ГОСТ 27466-87
(СТ СЭВ 360-86)
Группа П85
ГОСУДАРСТВЕННЫЙ СТАНДАРТ СОЮЗА ССР
Системы обработки информации
НАБОРЫ СИМВОЛОВ В 7- И 8-БИТНЫХ КОДАХ
Методы расширения кодов
Information processing systems. 7-bit and 8-bit coded character sets.
Code extension techniques
ОКСТУ 4002
Дата введения 1988-01-01
ИНФОРМАЦИОННЫЕ ДАННЫЕ
1. Постановлением Государственного комитета СССР по стандартам от 29.10.87 N 4077 стандарт Совета Экономической Взаимопомощи СТ СЭВ 360-86 "Системы обработки информации. Наборы символов в 7- и 8-битных кодах. Методы расширения кодов" введен в действие непосредственно в качестве государственного стандарта СССР c 01.01.88
2. Срок проверки - 1992 г., периодичность - 5 лет
3. ССЫЛОЧНЫЕ НОРМАТИВНО-ТЕХНИЧЕСКИЕ ДОКУМЕНТЫ
|
|
Обозначение НТД, на который дана ссылка | Номер пункта, приложения |
1.1, 1.2, 1.3, 2, 3.1.1-3.1.6, 3.1.8, приложения 3, 5, 6 | |
ГОСТ 19768-74* | 1.1, 1.2, 1.3, 2, приложения 5, 3 |
3.1.6-3.1.8, 3.2, приложение 3 |
ВНЕСЕНО Изменение N 1, утвержденное и введенное в действие Постановлением Государственного комитета СССР по управлению качеством продукции и стандартам от 30.01.90 N 117 с 01.01.91
Настоящий стандарт распространяется на технические и программные средства систем обработки информации и передачи данных и устанавливает методы расширения 7- и 8-битных совместимых кодов, структуры расширяемых 7- и 8-битных кодов и взаимосвязь между 7- и 8-битными кодами, а также классификацию методов расширения кода.
(Измененная редакция, Изм. N 1).
1. ОСНОВНЫЕ ПОЛОЖЕНИЯ
1.1a. Структура, наименование, определение и обозначение.
(Введен дополнительно, Изм. N 1).
1.1. Структура, наименование, определение и обозначение символов и кодовых позиций 7-битных кодов по ГОСТ 27463-87 и 8-битных кодов по ГОСТ 19768-74.
1.2. Цель расширения кода
Приведенный в ГОСТ 27463-87 7-битный код и в ГОСТ 19768-74 8-битный код позволяют представить наборы до 128 и до 256 символов соответственно. ГОСТ 27463-87 и ГОСТ 19768-74 позволяют представлять другие графические символы при помощи сочетания двух или более графических символов с управляющими символами ВОЗВРАТ НА ШАГ или ВОЗВРАТ КАРЕТКИ. Если наборы символов по ГОСТ 27463-87 или ГОСТ 19768-74 не содержат достаточного количества управляющих функций или графических символов, то эти требования могут быть удовлетворены при помощи методов расширения, установленных настоящим стандартом.
Правила, установленные в настоящем стандарте, могут быть использованы также для создания добавочных средств расширения кода, например, при формировании некоторых параметрических управляющих функций. В настоящем стандарте эти добавочные средства не описываются.
1.3. Расширяемые структуры кодов
Используя базисные структуры кодов, приведенные в ГОСТ 27463-87 и ГОСТ 19768-74, настоящий стандарт устанавливает различные средства расширения наборов управляющих функций и наборов графических символов кода, а также структуры и методы построения и формирования расширенных кодов, связанных с 7- и 8-битным кодами, а именно:
1) расширение 7-битного кода, остающееся в 7-битной среде;
2) структуру семейства 8-битных кодов, остающихся совместимыми с 7-битной структурой;
3) расширение 8-битного кода, остающееся в 8-битной среде;
4) связь между 7- и 8-битными кодами.
1.4. Преимущества идентичности методов расширения кода
С целью обеспечения идентичности методов расширения кода во всех вышеприведенных случаях и для облегчения их преобразования следует применять стандартные правила расширения кода. Это позволяет:
1) уменьшить вероятность противоречия между взаимодействующими системами;
2) обеспечить условия для расширения кода при проектировании систем;
3) предоставить стандартизованные методы вызова согласованных наборов символов;
4) обеспечить обмен данными между 7- и 8-битной средами и т.д.
1.5. Вид обрабатываемых данных
Методы расширения кода предназначены для применения при последовательной обработке данных в прямом направлении. Применение этих методов к данным, обрабатываемым иначе, или к форматизованным данным для обработки записей фиксированной длины может привести к нежелательным результатам или потребовать дополнительной специальной обработки с целью обеспечения правильной интерпретации.
1.6. Условия соблюдения требований к методам расширения кода
Настоящий стандарт включает множество возможностей расширения кода. В отдельных устройствах, средствах или системах можно использовать выбор из этих возможностей. Документация по устройствам, средствам и системам должна специфицировать подмножество выбранных возможностей методов расширения кода. Использованное подмножество методов расширения кода соответствует настоящему стандарту при выполнении следующих требований:
1) методы расширения кодов, описанные в настоящем стандарте, следует выполнять при помощи управляющих функций, установленных в настоящем стандарте, с принятыми для них обозначениями и кодовыми представлениями;
2) не следует применять кодированные представления, зарезервированные для будущей регистрации и стандартизации, значение которых необъявлено;
3) не следует применять никакие последовательности АР2 со значениями, отличными от зарегистрированных;
4) если требуется, чтобы две системы с различными подмножествами выбранных методов расширения кода осуществляли связь друг с другом, то для этой связи используют только общие методы расширения кода.
1.7а. Понятия и пояснения.
(Введен дополнительно, Изм. N 1).
1.7. Понятия и пояснения приведены в приложении 3.
1.8а. Процедуры регистрации.
(Введен дополнительно, Изм. N 1).
1.8. Комбинации битов, предназначенные для присвоения определенным наборам символов или определенным управляющим функциям для их вызова или обозначения, используют в соответствии с процедурами регистрации, сведения о которых приведены в приложении 4.
2. ФОРМЫ ЗАПИСИ
В настоящем стандарте в соответствии с ГОСТ 27463-87 и ГОСТ 19768-74 используют обозначения позиций кодовых таблиц, приведенные в приложении 5.
3. РАСШИРЕНИЕ 7-БИТНОГО КОДА В 7-БИТНОЙ СРЕДЕ
3.1. Введение
3.1.1. Структура 7-битного кода
7-битная кодовая таблица по ГОСТ 27463-87, приведенная в приложении 6, служит основой для методов расширения кода, применяемых к наборам символов в 7-битном коде.
3.1.2. Расширение заменой
Если требования ГОСТ 27463-87 не соответствуют требованиям какого-то применения, то эти требования могут быть удовлетворены при помощи использования подобным же образом структурированного кода, в котором некоторые из символов по ГОСТ 27463-87 заменены другими символами. Замену следует рассматривать, как создание нового кода, не установленного ГОСТ 27463-87.
3.1.3. Расширение увеличением состава символов
Настоящий стандарт позволяет увеличить состав символов, дополнительных по отношению к 128 символам, предусмотренным структурой 7-битного кода по ГОСТ 27463-87, следующими способами:
1) дополнительными единичными управляющими функциями;
2) дополнительными наборами из 32 управляющих функций;
3) дополнительными наборами из 94 графических символов;
4) дополнительными наборами из 96 графических символов;
5) дополнительными наборами из более чем 94 или 96 графических символов, каждый из которых представлен более чем одним байтом, т.е. многобайтными наборами.
Дополнительные наборы символов, приведенные выше в перечислениях 3)-5), не должны содержать ПРОБЕЛ и управляющие символы, включая ЗАБОЙ.
3.1.4. Элементы расширения кода
Конкретные применения требуют комбинаций вышеприведенных средств расширения кода. Элементы расширения кода показаны на черт.1, где наименования элементов определены следующим образом:
Элементы расширения кода
Черт.1
1) набор С0 - набор, состоящий из 32 управляющих символов (столбцы 0 и 1);
2) набор C1 - дополнительный набор, состоящий из 32 управляющих функций;
3) дополнительные единичные управляющие символы;
4) набор Г0 - набор, состоящий из 94 графических символов (комбинации битов с 2/1 по 7/14); многобайтный набор может также использоваться как набор Г0.
5) наборы Г1, Г2, Г3 - дополнительные наборы, состоящие из 94 графических символов (комбинации битов с 2/1 по 7/14) или из 96 графических символов (комбинации битов 2/0 по 7/15); многобайтные наборы могут использоваться как наборы Г1, Г2 или Г3.
Наборы управляющих и графических символов, которые совместимы с ГОСТ 27463-87, рекомендуется использовать как наборы С0 и Г0 соответственно.
3.1.5. Совместимость
Для обмена устанавливают различные уровни совместимости, которые могут сохраняться при применении средств расширения. Выделяют три уровня:
1) версия в соответствии с ГОСТ 27463-87;
2) вариант 7-битного кода, который является совместимым с ГОСТ 27463-87 с учетом следующих требований:
а) столбцы 0 и 1 содержат только управляющие символы;
б) десять управляющих символов связи и ПУС, ВЫХ, ВХ, АН, ЗМ, АР2, ПР и ЗБ сохраняют свои значения и позиции в кодовой таблице;
в) ПРОБЕЛ, ЗАБОЙ и один или два набора из 94 графических символов размещаются в столбцах со 2-го по 7-й; наборы из 96 графических символов, многобайтные наборы и функции переключения, иные чем ВХ и ВЫХ, не используются;
г) графические символы по ГОСТ 27463-87 не смещаются на другие позиции (это требование не распространяется на нелатинский алфавит, содержащий графические символы, которые входят также в латинский алфавит);
3) другие 7-битные коды, структурированные по п.3.1.1, которые могут содержать 94 графических символа, 96 графических символов и (или) многобайтные наборы в столбцах со 2-го по 7-й. С целью обеспечения возможностей расширения кода, описанных в настоящем стандарте, значения и позиции символов АВТОРЕГИСТР ДВА, ВЫХОД и ВХОД в кодовой таблице должны оставаться неизменными.
3.1.6. Символы расширения 7-битного кода.
ВХОД (ВХ) и АВТОРЕГИСТР ОДИН (AP1). Их определение приведено в ГОСТ 27465-87.
Настоящий стандарт не определяет использование управляющего символа АВТОРЕГИСТР ОДИН, который зарезервирован для обеспечения дополнительных управляющих функций связи.
(Измененная редакция, Изм. N 1).
3.1.7. Другие символы расширения кода
В ГОСТ 27465-87, кроме символов, перечисленных в п.3.1.6 настоящего стандарта, приведены для использования в 7-битной среде следующие, дополнительные управляющие функции переключения: ПЕРЕКЛЮЧАТЕЛЬ ДВА (П2), ПЕРЕКЛЮЧАТЕЛЬ ТРИ (П3), ПЕРЕКЛЮЧАТЕЛЬ ЕДИНИЧНЫЙ ДВА (ПЕ2), ПЕРЕКЛЮЧАТЕЛЬ ЕДИНИЧНЫЙ ТРИ (ПЕ3).
Способы кодирования управляющих функций указаны в приложении 1.
Дополнительные управляющие функции, предназначенные для использования в 8-битной среде, ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ОДИН (ПП1), ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ДВА (ПП2), ПЕРЕКЛЮЧАТЕЛЬ ВПРАВО ТРИ (ПП3) (см. п.5.2.1) используются в 7-битной среде только для преобразования данных из 7-битной в 8-битную среду и обратно (см. пп.7.2 и 7.4). Воздействие управляющих функций ПП1, ПП2 и ПП3 в 7-битном коде отвечает воздействию управляющих функций ВЫХ, П2 и П3 соответственно.
3.1.8. Комбинация графических символов
Для наборов графических символов, обеспечивающих представление дополнительных графических символов, таких как, например, символы с диакритическими знаками, при помощи комбинации двух или более графических символов в одной и той же позиции символа, предусматривают два способа комбинации графических символов в одной символьной позиции:
1) графические символы, включающие в себя прямое движение (интервальные символы), используются вместе с символом ВОЗВРАТ НА ШАГ или ВОЗВРАТ КАРЕТКИ;
2) графические символы, не осуществляющие прямое движение (неинтервальные символы), используются в комбинации с интервальными графическими символами.
ГОСТ 27463-87 допускает использование первого из этих двух способов для представления символов с диакритическими знаками (1 или 2-й уровни совместимости по п.3.1.5). Второй способ предназначается для 3-го уровня совместимости. Составителю графических наборов, который требует регистрации (см. приложение 4), следует идентифицировать все символы в наборе, которые не являются интервальными.
Новые стандарты, определяющие набор символов, должны содержать ограничение в комбинировании символов, если это не установлено при регистрации этого набора.
(Измененная редакция, Изм. N 1).
3.2. Расширение графического набора при помощи функций переключения
(Измененная редакция, Изм. N 1).
3.2.1. Использование функций блокирующего переключения
В 7-битной среде функции ВЫХОД (ВЫХ), ВХОД (ВХ), ПЕРЕКЛЮЧАТЕЛЬ ДВА (П2) и ПЕРЕКЛЮЧАТЕЛЬ ТРИ (П3) следует использовать исключительно для расширения графического набора.
Каждая из функций переключения ВЫХ, П2 или П3 вызывает дополнительный набор из 94 или 96 графических символов; Г1, Г2 и Г3 соответственно. Набор, содержащий 94 символа, вызывается в позиции с 2/1 по 7/14, ПРОБЕЛ в позицию 2/0 и ЗАБОЙ в позицию 7/15; набор, содержащий 96 символов, вызывается в позиции с 2/0 по 7/15. Допускается некоторым позициям дополнительных наборов не приписывать графические символы. Не требуется, за исключением случаев, описанных ниже, чтобы все графические символы дополнительного набора отличались от графических символов ранее вызванного набора.
Функция переключения ВХ должна вызывать 94 графических символа набора Г0 (в позиции 2/1 до 7/14) и должна способствовать, чтобы позиции 2/0 и 7/15 принимали их нормальное значение ПРОБЕЛ и ЗАБОЙ соответственно.
Если некоторый набор был уже вызван, то повторное использование соответствующей ему функции переключения не оказывает влияния.
Появление функций блокирующего переключения не должно влиять на значение следующих комбинаций:
1) представляющих управляющие символы в столбцах 0 и 1;
2) включенных в какую-либо последовательность АР2;
3) первую, следующую за ПЕ2 или ПЕ3.
Символы ПРОБЕЛ и ЗАБОЙ должны встречаться только в позициях 2/0 и 7/15 соответственно, если вызванный набор состоит из 94 графических символов; эти символы не должны приписывать каким-либо другим позициям в любом наборе.
Однако символы, иные чем ПРОБЕЛ, но представляющие пробелы других размеров или назначений, могут быть приписаны любым позициям в любом наборе графических символов или управляющих функций.
В начале любого обмена информацией необходимо определить состояние переключения путем использования одной из функций блокирующего переключения, как приведено в п.3.4 (см. также разд.6).
3.2.2. Использование функции единичного переключения
Функции единичного переключения ПЕ2, ПЕ3 используются исключительно для расширения графического набора. Функция ПЕ2 должна вызывать один символ из последнего обозначенного набора Г2, функция ПЕ3 - один символ из последнего обозначенного набора Г3.
Эти вызовы меняют значение одной непосредственно следующей комбинации битов (см. п.3.3.9) и приписывают ей значение соответствующей комбинации битов набора Г2 или Г3. Допускается, чтобы за ПЕ2 или ПЕ3 следовала только одна из комбинаций битов с 2/1 по 7/14 при наборах Г2 или Г3, содержащих 94 символа, и с 2/0 по 7/15 при наборах Г2 или Г3 с 96 символами (см. п.7.3). Использование функции единичного переключения не должно влиять на текущее состояние переключения, установленное функцией блокирующего переключения.
3.2.3. Единственные дополнительные графические наборы
В некоторых случаях требуется не более трех дополнительных графических наборов из 94 или 96 символов, которые могут быть однозначно идентифицированы как наборы Г1, Г2 и Г3. Эти наборы обозначают при помощи соответствующих последовательностей АР2, описанных в пп.3.3.7-3.3.10. Как указано в п.3.4, допускается этими последовательностями пренебречь на основании соглашения между обменивающимися сторонами. Любой из этих дополнительных наборов может быть в таком случае вызван при помощи соответствующих функций переключения.
3.2.4. Множественные графические наборы
Если необходимо иметь более трех дополнительных графических наборов или более одного графического набора, обозначенного как Г0 или Г1, или Г2, или Г3, то наборы Г0, Г1, Г2, Г3 следует обозначать при помощи соответствующих последовательностей АР2, описанных в пп.3.3.7-3.3.10. Каждое последующее использование функции переключения должно вызывать соответствующий заранее обозначенный набор.
Перед обозначением нового набора Г1, Г2, Г3 с помощью последовательности АР2 нет необходимости возвращаться к набору Г0 с использованием функции переключения ВХ.
Применение функции переключения должно вызывать графические символы набора, обозначенного последним для использования по этой функции переключения, но не допускается ее влияние на идентификацию любых ранее обозначенных наборов. Обозначенный набор может быть вызван произвольное число раз путем повторного использования соответствующей функции переключения до тех пор, пока этот набор не будет заменен набором с другой обозначающей последовательностью АР2.
Если другой набор графических символов обозначается последовательностью АР2, то текущее состояние переключателя должно остаться неизменным.
Если графический набор обозначается последовательностью АР2 и если в данный момент этот класс графического набора (т.е. Г0, Г1, Г2 или Г3) является вызванным, то новый набор должен считаться вызванным.
Схематическое представление описанных выше процессов обозначения и вызова приведено на черт.2.
(Измененная редакция, Изм. N 1).
Множественные графические наборы, использующие функции
блокирующего переключения
Черт.2
3.3. Расширение кода при помощи последовательностей АР2
3.3.1. Назначение последовательностей АР2
Последовательности АР2 позволяют пользоваться единичными управляющими функциями или наборами управляющих функций, не являющимися функциями связи. Последовательности АР2 также используются для обозначения наборов графических символов, для обозначения иных использований некоторых или всех комбинаций 7-битного кода и для обозначения кодированных наборов символов с числом битов, отличным от 7.
Последовательности АР2 необходимы для обеспечения:
1) единичной управляющей функции, не имеющейся в коде;
2) набора управляющих функций, не имеющихся в коде;
3) набора графических символов, не имеющихся в коде;
4) структуры кода, отличной от структуры данного кода.
3.3.2. Структура последовательностей АР2
Последовательность АР2 состоит из двух или более 7-битных комбинаций. Первая должна быть комбинацией битов, представляющей символ АР2, а последняя - комбинацией битов, представляющей конечный символ. Последовательность АР2 может также содержать любое число 7-битных комбинаций, представляющих промежуточные символы.
Значение последовательности АР2 должно быть определено 7-битной комбинацией, представляющей ее промежуточные символы, если они имеются, и 7-битной комбинацией, представляющей ее конечный символ.
Промежуточными символами являются 16 символов столбца 2 из 7-битной кодовой таблицы; они обозначены латинской буквой I.
Конечными символами являются 79 символов столбцов с 3 по 7 из 7-битной кодовой таблицы, за исключением позиции 7/15; они обозначены латинской буквой F.
Примечание. В настоящем стандарте последовательности АР2 представляются в наименованиях символов или в позициях кодовой таблицы, значение последовательности АР2 определяется только ее комбинациями битов и на него не влияет какое-либо значение, приписанное этим комбинациям битов, взятым отдельно.
Управляющие символы в столбцах 0 и 1 и символ в позиции 7/15 не допускается использовать как промежуточные или конечные символы при построении последовательности АР2.
Примечание. Эти запрещенные символы могут появиться в последовательности АР2 по ошибке, в некоторых применениях может оказаться необходимым использовать методы обнаружения этой ситуации и восстановления, но эти вопросы не рассматриваются настоящим стандартом.
3.3.3. Категории последовательностей АР2
Примечание. Пользователи какой-либо частной последовательности АР2 должны иметь в виду, что другие пользователи могут приписать другие значения этой же последовательности АР2 или могут применять другие последовательности АР2, которые означают одно и то же. Более того, такие значения могут в дальнейшем приписываться зарегистрированным последовательностям АР2. Обменивающиеся стороны предупреждаются, что использование подобных частных последовательностей АР2 может в последствии ограничить их возможности обмена данными.
3.3.2, 3.3.3. (Измененная редакция, Изм. N 1).
3.3.3.1. Двухсимвольные последовательности АР2 должны иметь форму АР2 F.
Эти последовательности АР2 используются для представления единичных дополнительных управляющих функций. 79 двухсимвольных последовательностей АР2 подразделяют на три типа в зависимости от конечного символа, как показано на черт.3.
Конечный символ для двухсимвольных последовательностей АР2
Черт.3
3.3.3.2. Трехсимвольные последовательности АР2 должны иметь форму АР2 I F.
В соответствии с назначением все типы трехсимвольных последовательностей АР2 сгруппированы по классам в соответствии с их промежуточными символами, как указано в пп.3.3.4-3.3.13 и табл.1.
Эти последовательности разделены на три типа в соответствии с их конечным символом, как показано на черт.4.
Промежуточные и конечные символы для трехсимвольных
последовательностей АР2
Черт.4
3.3.3.3. Последовательность АР2, имеющая четыре или больше символов, должна иметь форму АР2 I...I F, где I....I представляют два или более промежуточных символов.
Последовательность АР2, имеющие четыре или больше символов, должны интерпретироваться следующим образом:
1) первый промежуточный символ должен указывать класс использования, аналогичный классу с таким же промежуточным символом в трехсимвольной последовательности АР2;
2) за исключением случаев, у которых первый промежуточный символ зарезервирован или равен 2/0, 2/4, 2/5, или 2/6 (см. пп.3.3.12, 3.3.9, 3.3.11 и 3.3.13 или 6 соответственно) вторым промежуточным символом надо пользоваться по следующему правилу:
а) позиция 2/0 зарезервирована для обозначения динамически переопределяемых наборов символов (ДПНС) (см. п.3.3.10);
б) позиции 2/1, 2/2, 2/3 предназначены для регистрации управляющих функций и наборов графических символов;
в) позиции с 2/4 по 2/15 зарезервированы для будущей стандартизации;
3) третий и все последующие промежуточные символы предназначены для регистрации управляющих функций и наборов графических символов;
Для получения доступа к полной версии без ограничений вы можете выбрать подходящий тариф или активировать демо-доступ.