Інформація про символ (Unicode, UTF-8)

Інструмент інформації про символ відображає детальні технічні дані для кожного символу введеного тексту: кодову точку Unicode (U+XXXX), десяткове значення, HTML-сутність та байтове представлення UTF-8.

Що таке інструмент інформації про символ?

Це технічний інструмент для розробників і лінгвістів, що показує внутрішнє представлення кожного символу Unicode. Для кожного символу відображається: код Unicode (U+0041 для A), десяткове значення (65), HTML-сутність (A або &) та байти UTF-8. Усе виконується у браузері.

Як отримати інформацію про символи

Відкрийте Інформація про символ
Вставте або введіть текст
Перегляньте деталі кожного символу в таблиці

Реєстрація не потрібна.

Випадки використання

Визначення Unicode-коду незнайомого символу
Отримання HTML-сутності для вставки у веб-сторінку
Аналіз UTF-8 байтового представлення для розробки
Діагностика проблем з кодуванням тексту
Вивчення Unicode і кодувань символів
Перевірка невидимих або нестандартних символів у тексті
Пошук причин помилок при роботі з базами даних

Часті запитання

Що таке кодова точка Unicode? Кодова точка - це унікальний числовий ідентифікатор символу в стандарті Unicode. Записується у форматі U+ і шістнадцяткового числа. Наприклад, U+0041 для "A".

Що таке UTF-8? UTF-8 - це спосіб кодування Unicode-символів у байти. ASCII-символи займають 1 байт, кирилиця - 2 байти, більшість інших мов - 2-4 байти.

Чому для emoji потрібно кілька байтів? Emoji мають великі кодові точки Unicode і займають 4 байти в UTF-8 (і навіть 2 кодові одиниці в UTF-16).

Як це допомагає при відлагодженні? Якщо текст виглядає неправильно після обробки, перевірка кодових точок допомагає визначити, де відбулась заміна або пошкодження символів.

Спробуйте зараз: Інформація про символ