Является ли BOM (метка порядка байтов) управляющим символом?

Я знаю, что в компьютерах есть 4 типа персонажей:

  1. обычные символы (цифры или обычные буквы языка).
  2. управляющие символы (символы, используемые для осуществления как документально анализируется роботом или программой), как финиш (НЧ) и возврата каретки (CR).
  3. метазнаков (любой символ represting что-то, кроме себя).

можно сказать, что герои-Бом-тоже символ контроля как LF или CR?

20
задан DavidPostill
05.12.2022 6:48 Количество просмотров материала 3647
Распечатать страницу

2 ответа

можно сказать, что герои-Бом-тоже символ управления, как LF или CR?

нет. Это больше похоже на подпись:

Q: Что такое BOM?

A: метка заказа байта (BOM) состоит из кода символа U+FEFF на начало потока данных, где его можно использовать как подпись определение порядка байтов и формы кодирования, в первую очередь непомеченные текстовые файлы. Под некоторыми протоколами более высокого уровня, польза а BOM может быть обязательным (или запрещенным) в потоке данных Unicode определено в этом протоколе.

Source ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ - ПОДДЕРЖКА UTF-8, UTF-16, В КОДИРОВКЕ UTF-32 & СПЕЦИФИКАЦИИ


в вашем вопросе вы заявляете:

управляющие символы (символы, используемые для осуществления как документально анализируется роботом или программой), как финиш (НЧ) и возврата каретки (CR).

Это выше неправильный.

  1. LF обозначает строку Feed не линию финиша.

  2. управляющие символы не имеют ничего общего с тем, как анализ документа-это:

управляющий символ или непечатаемый символ-это кодовая точка (число) в наборе символов, которая не представляет записанный символ. Они используются как внутриполосная передача сигналов, чтобы вызвать эффекты помимо символа текст.

Source управление персонажем

2
отвечен DavidPostill 2022-12-06 14:36

по спецификации, я предполагаю, что вы имеете в виду порядок следования байтов Юникода указывают кодовое обозначение.

вы изобретаете свои собственные определения, поэтому определите BOM как любой тип, который вы хотите.

разработчики стандарта Unicode имеют свои собственные определения. См.Стандарт Unicode, версия 9.0.0, раздел 3.4 символы и кодировки. Определение D10a определяет "тип кодовой точки" как " семь основных классов кодовых точек в стандарте: графический, Формат, Контроль, Частное Использование, Суррогат, Нехарактерный, Зарезервирован". Эти типы подробно объясняются в Глава 23 специальные области и символы формата. Раздел 23.8 спец определяет U+FEFF, "Знак порядка байтов", как имеющий тип кодовой точки"специальный".

Итак, разработчики стандарта Unicode имеют список из 7 типов кодовых точек, а Знак порядка байтов имеет тип "Special". Однако включите это в свое определение ты желаешь.

1
отвечен Jim DeLaHunt 2022-12-06 16:53

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх