ГОСТ Р ИСО/МЭК 16022-2008 Автоматическая идентификация. Кодирование штриховое. Спецификация символики Data Matrix.

         

     ГОСТ Р ИСО/МЭК 16022-2008

 

Группа П85

     

 

      

НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ

 

 

 Автоматическая идентификация

 

 КОДИРОВАНИЕ ШТРИХОВОЕ

 

 Спецификация символики Data Matrix

 

 Automatic identification. Bar coding. Data Matrix symbology specification

 

 

 

ОКС 35.040

Дата введения 2010-01-01

 

      

     

Предисловие

Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 "Стандартизация в Российской Федерации. Основные положения"*

                

Сведения о стандарте

 

1 ПОДГОТОВЛЕН Ассоциацией автоматической идентификации "ЮНИСКАН/ГС1 РУС" совместно с Обществом с ограниченной ответственностью (ООО) НПЦ "Интелком" на основе аутентичного перевода стандарта, указанного в пункте 4, выполненного ООО НПЦ "Интелком"

 

2 ВНЕСЕН Техническим комитетом по стандартизации ТК 355 "Автоматическая идентификация"

 

3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 18 декабря 2008 г. N 509-ст

 

4 Настоящий стандарт идентичен международному стандарту ИСО/МЭК 16022:2006* "Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация символики штрихового кода Data Matrix" (ISO/IEC 16022:2006 "Information technology - Automatic identification and data capture techniques - Data Matrix bar code symbology specification"), за исключением приложения U, содержащего сведения о соответствии терминов на русском и английском языках, приложения V, включающего в себя сведения о наборах знаков по ИСО/МЭК 646, ИСО/МЭК 8859-1 и ИСО/МЭК 8859-5. В приложении М приведены исправления в соответствии со списком технических опечаток 1 (Technical Corrigendum 1) к ISO/IEC 16022.1:2006.

Наименование национального стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004* (подраздел 3.5) и учета его принадлежности к группе стандартов "Автоматическая идентификация".

При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных (региональных) стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении W

 

5 ВВЕДЕН ВПЕРВЫЕ         

 

     ВНЕСЕНО Изменение N 1, утвержденное и введенное в действие Приказом Росстандарта от 26.09.2013 N 1112-ст c 01.01.2014  

 

Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе "Национальные стандарты", а текст изменений и поправок -  в ежемесячно издаваемых информационных указателях "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе "Национальные стандарты". Соответствующая информация, уведомления и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет

 

 Введение

Data Matrix - двухмерная матричная символика, состоящая из квадратных модулей, упорядоченных внутри периметра шаблона поиска. В настоящем документе представление символа и его описание приведено, главным образом, для темных модулей на светлом фоне. Тем не менее, символы Data Matrix также могут быть напечатаны в виде светлых модулей на темном фоне.

 

Производителям оборудования и пользователям технологии штрихового кодирования необходима общедоступная стандартная спецификация символики, на которую они могли бы ссылаться при разработке оборудования и стандартов по применению. С этой целью и был разработан настоящий стандарт.

 

Следует обратить внимание на возможность того, что некоторые элементы, включенные в настоящий стандарт, могут быть объектом патентного права, и организации ИСО и МЭК не берут на себя ответственность за определение некоторых или всех подобных патентных прав.

 

Сноски в тексте стандарта, выделенные курсивом, приведены для пояснения текста стандарта.

 

 

      1 Область применения

Настоящий стандарт устанавливает требования к символике Data Matrix*, а также параметры символики, кодирование знаков данных, форматы символов, требования к размерам и качеству печати, правила исправления ошибок, алгоритм декодирования и прикладные параметры, выбираемые пользователем.

________________

* Название символики произносится как Дата Матрикс, что в переводе на русский язык - "матрица данных".

 

Настоящий стандарт распространяется на все символы символики Data Matrix, напечатанные или нанесенные каким-либо другим способом.

 

 

      2 Нормативные ссылки

В настоящем стандарте использованы нормативные ссылки на следующие стандарты и другие нормативные документы*, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним:

ИСО/МЭК 15424 Информационные технологии. Технологии автоматической идентификации и сбора данных. Идентификаторы носителей данных (включая идентификаторы символик) (Information technology - Automatic identification and data capture techniques - Data Carrier Identifiers (including Symbology Identifiers)

 

ИСО/МЭК 19762-1 Информационные технологии. Технологии автоматической идентификации и сбора данных. Гармонизированный словарь. Часть 1. Общие термины, связанные с автоматической идентификацией и сбором данных (Information technology - Automatic identification and data capture (AIDC) techniques - Harmonized vocabulary - Part 1: General terms relating to AIDC)

 

ИСО/МЭК 19762-2 Информационные технологии. Технологии автоматической идентификации и сбора данных. Гармонизированный словарь. Часть 2. Средства для оптического считывания (Information technology - Automatic identification and data capture (AIDC) techniques - Harmonized vocabulary - Part 2: Optically readable media (ORM))

 

ИСО/МЭК 15415 Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация испытаний качества печати символов штрихового кода. Двумерные символы (Information technology - Automatic identification and data capture techniques - Bar code print quality test specification - Two-dimensional symbols)

 

ИСО/МЭК 15416 Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация испытаний качества печати символов штрихового кода. Линейные символы (Information technology - Automatic identification and data capture techniques - Bar code print quality test specification - Linear symbols)

 

ИСО/МЭК 646:1991 Информационные технологии. Набор 7-битовых кодированных знаков ИСО для обмена информацией (Information technology - ISO 7-bit coded character set for information interchange)

 

ИСО/МЭК 8859-1 Информационные технологии. Наборы 8-битовых однобайтных кодированных графических знаков. Часть 1. Латинский алфавит N 1 (Information technology - 8-bit single-byte coded graphic character sets - Part 1: Latin alphabet N 1)

 

ИСО/МЭК 8859-5:1999 Информационные технологии. Наборы 8-битовых однобайтных кодированных графических знаков. Часть 5. Латинский/кирилловский алфавит (Information technology - 8-bit single-byte coded graphic character sets - Part 5: Latin/Cyrillic alphabet)

 

AIM Inc. ITS/04-001 Международный технический стандарт. Интерпретации в расширенном канале. Часть 1. Схемы идентификации и протокол (AIM Inc. ITS/04-001 International Technical Standard: Extended Channel Interpretations - Part 1: Identification Schemes and Protocol)

 

 

      3 Термины, определения, символы и математические/логические обозначения

 

 

      3.1 Термины и определения

В данном документе используются термины, определенные в ИСО/МЭК 19762-1, ИСО/МЭК 19762-2, а также следующие:

 

3.1.1 кодовое слово (codeword): Значение знака символа, формируемое на промежуточном уровне кодирования в процессе преобразования исходных данных в их графическое представление в символе.

 

3.1.2 модуль (module): Отдельная ячейка матричной символики, используемая для кодирования одного бита информации и имеющая номинально квадратную форму в символах Data Matrix.

 

3.1.3 сверточное кодирование (convolutional coding): Алгоритм контроля и исправления ошибок, преобразующий множество битов на входе во множество битов на выходе, которое может быть восстановлено после повреждения, путем кодирования с разделением множества входящих битов на блоки с последующим проведением операции свертки каждого входящего блока с регистром сдвига со множеством состояний для получения защищенных на выходе блоков.

 

Примечание - Такие алгоритмы кодирования могут быть реализованы с помощью аппаратных средств путем использования входных и выходных коммутаторов, регистров сдвига и вентилей исключающих ИЛИ*.

________________

* Международное обозначение операции исключающее ИЛИ: exclusive-or - XOR.

 

3.1.4 шаблонная рандомизация (pattern randomising): Процедура, с помощью которой исходный набор битов превращают в другой набор битов путем инвертирования отдельных битов с целью уменьшения вероятности повторения в символе одинаковых наборов.

 

 

      

 

      3.2 Символы

В данном документе, если иное не предусмотрено в особых случаях, применяют следующие математические символы:

 

 

 

 

- число кодовых слов исправления ошибок;

 

- число стираний;

 

- (для версии ЕСС 000-140) число битов в полном сегменте на входе в конечный автомат для генерирования сверточного кода;

 

(для версии ЕСС 200) общее число кодовых слов исправления ошибок;

 

- порядок памяти сверточного кода;

 

- (для версии ЕСС 000-140) число битов в полном сегменте, сгенерированных конечным автоматом, порождающим сверточный код;

(для версии ЕСС 200) общее число кодовых слов данных;

 

- числовое основание в схеме кодирования;

 

- число кодовых слов, зарезервированных для обнаружения ошибок;

 

- знак символа;

 

- число ошибок;

 
- сегмент битов на входе в конечный автомат, принимающий
битов за единицу времени;
 
 
- сегмент битов на выходе из конечного автомата, генерирующего
битов за единицу времени;
 
 

- горизонтальный и вертикальный размеры модуля;

 

- кодовое слово исправления ошибок.

 

 

      

 

      3.3 Математические обозначения

В настоящем стандарте используются следующие обозначения и математические операции:

 

 

 

div

- оператор деления на целое число;

mod

- остаток при делении на целое число;

XOR

- исключающее ИЛИ (exclusive-or) - логическая функция или операция, результатом которой является единица только в случае неэквивалентности двух входов;

LSB

- младший значащий разряд (Least Significant Bit);

MSB

- старший значащий разряд (Most Significant Bit).

 

 

      

 

      4 Описание символов

 

 

      4.1 Основные параметры

     

Data Matrix представляет собой двумерную матричную символику.

 

Существуют две версии символики Data Matrix:

 

- версия, обозначаемая ЕСС 200, в которой используют алгоритм исправления ошибок Рида-Соломона. Версия ЕСС 200 рекомендуется для разработки любого нового применения;

 

- версия, обозначаемая ЕСС 000-140, с несколькими доступными уровнями сверточного исправления ошибок, такими как ЕСС 000, ЕСС 050, ЕСС 080, ЕСС 100 и ЕСС 140. Версию ЕСС 000-140 следует использовать только для замкнутых прикладных систем, в которых одна и та же сторона контролирует создание и считывание символов и обеспечивает функционирование всей системы.

 

Символика Data Matrix имеет следующие параметры:

 

a) кодируемый набор знаков:

 

1) знаки набора ASCII (версии КОИ-7) по ИСО/МЭК 646* (согласно национальной версии США**) (далее - знаки ASCII (КОИ-7)) с десятичными значениями от 0 до 127.

________________

* Набор знаков ASCII (версия КОИ-7) по ИСО/МЭК 646 приведен в приложении V.

 

** Набор знаков по ANSI INCITS 4-1986 (R2007) Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII) (Информационные системы - Кодированные наборы знаков - 7-битовый американский национальный стандартный код для обмена информацией (7-битовый ASCII).

 

Примечание 1 - Указанная версия ASCII (КОИ-7) состоит из набора знаков G0 по ИСО/МЭК 646 и С0 по ИСО/МЭК 6429, в котором знаки с десятичными значениями от 28 до 31 соответствуют знакам FS, GS, RS и US соответственно;

           

2) знаки расширенного набора ASCII (версия КОИ-8) по ИСО/МЭК 8859-1* (далее - знаки расширенного набора ASCII (КОИ-8)) с десятичными значениями от 128 до 255;

 

b) представление данных: темный модуль соответствует двоичной единице, светлый - двоичному нулю.

________________

* Набор знаков расширенного набора ASCII (КОИ-8) приведен в приложении V.

 

Примечание 2 - Настоящий стандарт определяет символы Data Matrix как темные модули, расположенные на светлом фоне. Однако в 4.2 предусмотрено, что символы могут также быть образованы с заменой цвета на противоположный, и для таких символов положения настоящего стандарта в отношении темных модулей должны применяться к светлым модулям и наоборот;

 

c) размеры символа в модулях (без учета свободной зоны):

 

- для версии ЕСС 200 - от 10х10 до 144х144, только четные значения;

 

- для версии ЕСС 000-140 - от 9х9 до 49 на 49, только нечетные значения;

 

d) число знаков данных в символе (для символа максимального размера версии ЕСС 200):

 

1) алфавитно-цифровые данные - до 2335 знаков,

 

2) в 8-битовых байтах - 1555 знаков,

 

3) числовые данные - 3116 числовых разрядов;

 

e) задаваемое исправление ошибок:

 

- для версии ЕСС 200 - исправление ошибок Рида-Соломона;

 

- для версии ЕСС 000-140 - четыре уровня исправления ошибок на основе сверточного кода плюс (по выбору) только обнаружение ошибки;

 

f) тип кода: матричный;

 

g) независимость от ориентации: присутствует.

 

 

      

 

      4.2 Дополнительные свойства

Символика Data Matrix обладает следующими дополнительными, неотъемлемыми или устанавливаемыми по выбору свойствами:

 

a) обратимость изображения (неотъемлемое свойство). Символы предназначены для считывания как напечатанные темным на светлом фоне, так и светлым на темном фоне (рисунок 1). Положения настоящего стандарта установлены для темного изображения на светлом фоне, следовательно указания о темных или светлых модулях должны рассматриваться как указания о светлых или темных модулях соответственно для символов с обращением изображения;

 

b) интерпретации в расширенном канале (только для версии ЕСС 200, свойство по выбору). Данный механизм позволяет использовать знаки из иных наборов (например, знаки арабского, кирилловского, греческого, еврейского алфавитов) и иных различных интерпретаций данных или представлять их в соответствии с особыми отраслевыми требованиями;

 

c) прямоугольная форма символов (только для версии ЕСС 200, свойство по выбору). Установлены шесть форматов символа прямоугольной формы;

 

d) структурированное соединение (только для версии ЕСС 200, свойство по выбору). Позволяет представить один документ в виде нескольких (до 16) символов Data Matrix. Исходные данные могут быть восстановлены вне зависимости от порядка сканирования символов.

 

 

а) темное изображение на светлом фоне для версии ЕСС 200

 

 

b) светлое изображение на темном фоне для версии ЕСС 200

 

 

с) темное изображение на светлом фоне для уровня ЕСС 140

 

Рисунок 1 - Пример кодирования сообщения "A1B2C3D4E5F6G7H8I9J0K1L2" в символе версии ЕСС 200 (рисунки а) и b)) и уровня ЕСС 140 (рисунок с))

 

      

     

 

      4.3 Структура символов

Каждый символ Data Matrix состоит из областей данных, составленных из номинально квадратных модулей, структурированных в регулярную матрицу. В больших символах версии ЕСС 200 области данных отделены направляющими шаблонами. Область данных окружена шаблоном поиска, вокруг которого со всех четырех сторон должна быть свободная зона. На рисунке 1 приведен пример символа уровня ЕСС 140 и два примера символа версии ЕСС 200.

 

4.3.1 Шаблон поиска

 

Шаблоном поиска является периметр области данных шириной в один модуль. Две смежные стороны - левая и нижняя, являются сплошными темными линиями и формируют L-образную границу. Они используются, прежде всего, для определения реального размера, ориентации и искажений символа. Две противоположные стороны состоят из чередующихся темных и светлых модулей. Они используются, прежде всего, для определения структуры символа, состоящей из ячеек, но также могут применяться для определения физического размера и искажений символа. Наличие свободной зоны обозначено на рисунке 1 угловыми метками.

 

4.3.2 Размеры и емкость символов

 

Символы версии ЕСС 200 состоят из четного числа строк и четного числа столбцов. Символы версии ЕСС 200 могут быть квадратной формы с размерами (в модулях) от 10х10 до 144х144 без учета свободных зон, либо прямоугольной формы размерами (в модулях) от 8х18 до 16х48 без учета свободных зон. Все символы версии ЕСС 200 можно распознать по светлому модулю в правом верхнем углу. Полный перечень атрибутов символа версии ЕСС 200 приведен в 5.5 (таблица 7).

 

Символы версии ЕСС 000-140 состоят из нечетного числа строк и нечетного числа столбцов. Символы версии ЕСС 000-140 имеют квадратную форму размерами от 9х9 до 49х49 модулей без учета свободных зон. Данные символы можно распознать по темному модулю в правом верхнем углу. Полный перечень атрибутов символов версии ЕСС 000-140 приведен в приложении G.

 

 

      

 

      5 Требования к символам версии ЕСС 200

 

 

      5.1 Основные положения процедуры кодирования

Настоящий раздел содержит общие сведения о процедуре кодирования. В следующих разделах приведено более детальное рассмотрение указанной процедуры. Пример кодирования для символа версии ЕСС 200 приведен в приложении О. Преобразование данных пользователя в символ версии ЕСС 200 происходит в следующей последовательности:

 

Этап 1. Кодирование данных

 

Анализируют поток данных для определения разнообразия типов различных знаков, подлежащих кодированию. Символы версии ЕСС 200 содержат различные схемы кодирования, которые позволяют найденные множества знаков преобразовать в кодовые слова более эффективно по сравнению со схемой кодирования, принятой по умолчанию. Вводят дополнительные кодовые слова для переключения между схемами кодирования и для выполнения других функций. Добавляют необходимое количество знаков-заполнителей для образования требуемого числа кодовых слов. Если пользователь не установил размер матрицы, то выбирают наименьший размер, в котором могут быть размещены данные. Полный перечень размеров матриц приведен в 5.5 (таблица 7).

 

Этап 2. Формирование кодовых слов проверки и исправления ошибок

 

Для символов, содержащих более 255 кодовых слов, поток кодовых слов подразделяют на чередующиеся блоки, чтобы дать возможность обработки алгоритмами исправления ошибок (приложение А). Для каждого блока формируют кодовые слова исправления ошибок. Результатом этого процесса является удлинение потока кодовых слов на число кодовых слов исправления ошибок. Кодовые слова исправления ошибок помещают после кодовых слов данных.

 

Этап 3. Размещение модулей в матрице

Модули кодовых слов размещают в матрице. В матрицу вставляют модули направляющих шаблонов (при их наличии). Вокруг матрицы добавляют модули шаблона поиска.

 

 

      5.2 Кодирование данных

5.2.1 Общие положения

 

Данные можно кодировать с использованием любой комбинации из шести схем кодирования (таблица 1), при этом кодирование по схеме ASCII (КОИ-7/КОИ-8) является основной схемой. Остальные схемы кодирования вызываются из схемы кодирования ASCII (КОИ-7/КОИ-8) с последующим возвратом к этой же схеме. Следует учитывать эффективность уплотнения (число битов на знак данных), приведенную в таблице 1. Лучшей схемой для выбранного набора данных может оказаться не та, у которой на знак данных приходится наименьшее число битов. Если требуется наибольшая степень уплотнения, то надо принимать в расчет служебную информацию для переключения между схемами кодирования и наборами знаков внутри одной схемы кодирования (приложение Р). Следует также учитывать, что даже если число кодовых слов минимизировано, поток кодовых слов может нуждаться в расширении для полного заполнения символа. Дополнение осуществляют путем использования знаков-заполнителей.

 

 

Таблица 1 - Схемы кодирования для символов версии ЕСС 200

 

 

 

Наименование схемы кодирования

Знаки

Число битов на один знак данных

ASCII

Сдвоенные разряды чисел

4

(КОИ-7/

Знаки ASCII (КОИ-7) с десятичными значениями от 0 до 127

8

КОИ-8)

Знаки расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255

16

С40

Цифры и прописные латинские буквы

5,33

 

 

 

Специальные знаки и строчные латинские буквы

10,66*

Text

Цифры и строчные латинские буквы

5,33

 

 

 

Специальные знаки и прописные латинские буквы

10,66**

ANSI X12

Набор знаков данных для электронного обмена данными по ANSI X12 EDI

5,33

EDIFACT

Знаки ASCII (КОИ-7) с десятичными значениями от 32 до 94

6

По основанию 256

Любые байты с десятичными значениями от 0 до 255

8

* Кодируют как два значения в схеме кодирования С40 с использованием знака регистра (Shift).

 

 

** Кодируют как два значения в схеме кодирования Text с использованием знака регистра (Shift).

 

5.2.2 Интерпретация знаков по умолчанию

 

Интерпретация знаков по умолчанию для знаков с десятичными значениями от 0 до 127 должна соответствовать версии КОИ-7 по ИСО/МЭК 646, а для знаков с десятичными значениями от 128 до 255 - версии КОИ-8 по ИСО 8859-1 "Латинский алфавит N 1". Графические представления знаков данных, приведенных в настоящем стандарте, соответствуют интерпретации по умолчанию. Эта интерпретация может быть изменена с помощью переключающих последовательностей интерпретации в расширенном канале (5.4). Интерпретацией по умолчанию является ECI 000003.

 

5.2.3 Схема кодирования ASCII (КОИ-7/КОИ-8)

 

Схема кодирования ASCII (КОИ-7/КОИ-8) представляет собой набор знаков по умолчанию для первого знака символа в символах любого размера. С помощью указанной схемы кодируют знаки ASCII (КОИ-7) и расширенного набора ASCII (КОИ-8), числовые данные двойной плотности и управляющие знаки символики. Управляющие знаки символики включают в себя функциональные знаки, знак-заполнитель и знаки-переключатели на другие кодовые наборы. Знаки данных ASCII (КОИ-7) кодируют как кодовые слова с десятичными значениями от 1 до 128 (десятичное значение знака КОИ-7 плюс 1). Знаки данных расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255 кодируют с использованием управляющего знака верхнего регистра (Upper Shift) (5.2.4.2). Пары цифр от 00 до 99 кодируют кодовыми словами от 130 до 229 (числовое значение плюс 130). Присвоенные значения кодовых слов для схемы кодирования ASCII (КОИ-7/КОИ-8) приведены в таблице 2.

 

 

Таблица 2 - Значения кодовых слов в схеме кодирования ASCII (КОИ-7/КОИ-8)

 

 

Значение кодового слова

Знак данных или функция

1-128

Знаки данных ASCII (КОИ-7) (десятичное значение знака +1)

129

Знак-заполнитель

130-229

Пары цифр от 00 до 99 (числовое значение +130)

230

Знак фиксации схемы кодирования С40

231

Знак фиксации схемы кодирования по основанию 256

232

Знак FNC1

233

Знак структурированного соединения

234

Знак программирования устройства считывания

235

Знак верхнего регистра (переход к расширенному набору ASCII (КОИ-8))

236

Знак Макро 05

237

Знак Макро 06

238

Знак фиксации схемы кодирования Х12

239

Знак фиксации схемы кодирования Text

240

Знак фиксации схемы кодирования EDIFACT

241

Знак интерпретации в расширенном канале (ECI)

242-255

Не подлежит использованию в схеме кодирования ASCII (КОИ-7/КОИ-8)

 

5.2.4 Управляющие знаки символики

 

В символах версии ЕСС 200 есть несколько специальных управляющих знаков символики, имеющих особое значение для схемы кодирования. Эти знаки должны использоваться для сообщения команды декодеру на выполнение определенных функций или передачи управляющему компьютеру специальных данных (5.2.4.1-5.2.4.9). Эти управляющие знаки символики, за исключением знаков с десятичными значениями от 242 до 255, присутствуют в кодовом наборе ASCII (КОИ-7/КОИ-8) (таблица 2).

 

5.2.4.1 Знаки фиксации схемы кодирования (Latch)

 

Для переключения из схемы кодирования ASCII (КОИ-7/КОИ-8) в любую иную схему кодирования используют знаки фиксации. Все кодовые слова после знака фиксации должны кодироваться в соответствии с новой схемой кодирования. Различные схемы кодирования имеют свои способы возврата к кодовому набору ASCII (КОИ-7/КОИ-8).

 

5.2.4.2 Знак верхнего регистра (Upper Shift)

 

Знак верхнего регистра используется в комбинации с знаком ASCII (КОИ-7) для кодирования знака расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255. Знак расширенного набора ASCII (КОИ-8), кодируемый в схемах кодирования ASCII (КОИ-7/КОИ-8), С40 или Text, требует наличия предшествующего знака верхнего регистра, после которого стоит знак ASCII (КОИ-7), десятичное значение которого уменьшено на 128. Эту пару кодируют в соответствии с правилами схемы кодирования. В схеме кодирования ASCII (КОИ-7/КОИ-8) знак верхнего регистра представлен кодовым словом со значением 235. Уменьшенное десятичное значение знака данных (т.е. десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128) преобразуют в значение кодового слова путем прибавления к его значению единицы. Например, для кодирования знака
(ДЕНЕЖНЫЙ ЗНАК ИЕНЫ, десятичное значение которого равно 165) следует после знака верхнего регистра (кодовое слово со значением 235) поставить знак ASCII (КОИ-7) с десятичным значением 37 (165-128), которое кодируется как кодовое слово со значением 38. При наличии протяженных последовательностей знаков данных расширенного набора ASCII (КОИ-8), более эффективное кодирование может быть достигнуто путем использования знака фиксации схемы кодирования по основанию 256.
 

5.2.4.3 Знак-заполнитель (Pad)

 

Если кодируемых данных, независимо от используемой схемы кодирования, не хватает для полного заполнения символа для данных, то оставшаяся часть символа для данных должна быть заполнена знаками-заполнителями. Знаки-заполнители должны использоваться исключительно для указанной цели. Перед вводом знака-заполнителя необходимо вернуться к схеме кодирования ASCII (КОИ-7/КОИ-8) из любой другой используемой схемы кодирования.

 

Алгоритм рандомизации с шаблоном из 253 состояний применяют к знакам-заполнителям, ко всей последовательности знаков-заполнителей, начиная со второго знака-заполнителя и до конца символа (приложение В.1).

 

5.2.4.4 Знак интерпретации в расширенном канале (ECI)

 

Знак интерпретации в расширенном канале (ECI) используют для смены интерпретации, принятой по умолчанию, на иную интерпретацию, применяемую для кодирования данных. Протокол интерпретации в расширенном канале является общим для многих символик и его применение к символике версии ЕСС 200 более полно определено в 5.4. После знака ECI обязательно должны следовать одно, два или три кодовых слова, которые идентифицируют конкретную активизируемую ECI. Новая ECI действует до конца кодируемых данных или до тех пор, пока другой знак ECI не вызовет иную интерпретацию.

 

5.2.4.5 Знаки регистра (Shift) в схемах кодирования С40 и Text

 

В схемах кодирования С40 и Text используют три специальных знака, называемые знаками регистра, в качестве префикса к одному из 40 значений для кодирования примерно трех четвертей набора знаков ASCII (КОИ-7). Это позволяет добиться более компактного кодирования оставшихся знаков ASCII (КОИ-7) с помощью одиночных значений*.

________________

     * Без предшествующего знака "Регистр" перед каждым знаком.

5.2.4.6 Знак FNC1 как идентификатор альтернативного типа данных

 

Для кодирования данных, соответствующих специальным международным отраслевым стандартам, одобренных AIM Inc, знак FNC1 должен присутствовать в позиции первого или второго знака символа (либо пятой или шестой позиции данных в первом символе структурированного соединения символов). Знак FNC1, кодируемый в позиции любого иного знака символа, используют как разделитель полей, и он подлежит передаче как управляющий знак
(знак ASCII (КОИ-7) с десятичным значением 29).
 

5.2.4.7 Знаки Макро (Macro)

 

Символика Data Matrix обеспечивает представление специальных международных отраслевых головной и конечной меток в одном знаке символа, которое сокращает число знаков символа, необходимых для кодирования данных в символе при использовании установленных структурированных форматов. Любой знак Макро применяют только в позиции первого знака символа. Эти знаки не должны использоваться вместе со структурированным соединением (Structured Append). Функции знаков Макро приведены в таблице 3. Головная метка должна быть включена в передаваемый поток данных в виде префикса, а конечная метка - суффикса*. Если используют идентификатор символики, то он должен предшествовать головной метке.

________________

* Суффикс является завершающим дополнением к потоку данных.

 

Таблица 3 - Функции знаков Макро

 

 

 

 

Значение кодового слова знака Макро

Обозначение знака

Интерпретация метки

 

 

 

 

Головная метка

Конечная метка

236

Макро 05

*
 
**
 

237

Макро 06

***
 
 

 

________________

* Знаки КОИ-7 (ASCII) с десятичными значениями 91, 41, 62, 30, 48, 53, 29.

 

** Знаки КОИ-7 (ASCII) с десятичными значениям 30, 4.

 

*** Знаки КОИ-7 (ASCII) с десятичными значениями 91, 41, 62, 30, 48, 54, 29.

 

   

5.2.4.8 Знак структурированного соединения (Structured Append)

 

Знак структурированного соединения используют для указания того, что символ является частью последовательности символов структурированного соединения в соответствии с 5.6.

 

5.2.4.9 Знак программирования устройства считывания

 

Знак программирования устройства считывания указывает на то, что в символе закодировано сообщение, предназначенное для программирования устройства считывания. Знак программирования устройства считывания должен быть первым кодовым словом символа и не подлежит использованию совместно со структурированным соединением.

 

5.2.5 Схема кодирования С40

 

Схему кодирования С40 применяют для оптимизации кодирования данных, состоящих из последовательности, включающей прописные буквы латинского алфавита и числа (включая знак ПРОБЕЛ). Данная схема позволяет также кодировать и другие знаки путем использования знаков регистра в комбинации с другими знаками данных.

 

Знаки данных в схеме кодирования С40 разделены на четыре набора. Знаки из первого набора, называемого основным набором, содержат три специальных знака регистра, знак ПРОБЕЛ и знаки ASCII (КОИ-7) c A по Z и с 0 по 9. Каждому знаку данных соответствует единственное значение схемы кодирования С40 (далее - значение С40). Знаки других наборов присваивают одному из трех знаков регистра, которые указывают на один из трех оставшихся наборов и сопровождаются одним из значений С40 (приложение С, таблица С.1).

 

В результате первого этапа кодирования каждый знак данных преобразуют в одно значение С40 или в пару значений С40. Затем полную строку значений С40 разбивают на группы по три значения (если в конце данных остается одно или два значения, то применяют специальные правила, приведенные в 5.2.5.2.). После этого три значения (С1, С2, С3) кодируют как одно 16-битовое значение по формуле (1600хС1)+(40хС2)+С3+1. В завершение каждое 16-битовое значение кодируют в двух кодовых словах, представляющих собой восемь старших битов и восемь младших битов.

 

5.2.5.1 Переключение на схему кодирования С40 и обратно

 

На схему кодирования С40 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования С40 со значением 230. Кодовое слово со значением 254, непосредственно следующее за парой кодовых слов в схеме кодирования С40, действует как отказ от фиксации (Unlatch) для возврата к схеме кодирования ASCII (КОИ-7/КОИ-8). В противном случае кодирование по схеме кодирования С40 сохраняется до окончания данных, закодированных в символе.

 

5.2.5.2 Правила кодирования С40

 

Каждая пара кодовых слов представляет собой 16-битовое значение, в котором первое кодовое слово соответствует восьми старшим битам, а второе - восьми младшим битам. Три значения С40 (С1, С2, С3) кодируют по формуле (1600хС1)+(40хС2)+С3+1.

 

В результате получают значения от 1 до 64000. Уплотнение трех значений С40 в два кодовых слова представлено на рисунке 2.

 

 

 

Исходные знаки данных

AIM

Полученные значения С40

14, 22, 26

Вычисление 16-битового значения

(1600х14)+(40х22)+26+1=23307

Определение первого кодового слова: (16-битовое значение) div 256

23307 div 256=91

Определение второго кодового слова: (16-битовое значение) mod 256

23307 mod 256=11

Итоговые кодовые слова

91, 11

 

     

Рисунок 2 - Пример кодирования по схеме кодирования С40

Для кодирования знаков, принадлежащих наборам Регистр 1 (Shift 1), Регистр 2 (Shift 2) и Регистр 3 (Shift 3), сначала следует закодировать соответствующий знак регистра, а затем - значение С40 для данных. Кодирование по схеме С40 может действовать до окончания кодовых слов символа, кодирующих данные.

 

В случае, если в символе остается только один или два знака символа до начала следования кодовых слов исправления ошибки, то следует придерживаться следующих правил:

 

a) если остаются два знака символа и кодированию подлежат три оставшихся значения С40 (которые могут включать как знаки данных, так и знаки регистра (Shift)), то эти три значения С40 кодируют в двух последних знаках символа. Заключительного кодового слова отказа от фиксации схемы кодирования (Unlatch) не требуется;

 

b) если остаются два знака символа и кодированию подлежат два оставшихся значения С40 (первое из которых может быть знаком регистра (Shift) или знаком данных, а второе должно представлять знак данных), то эти два оставшиеся значения С40 кодируют с добавлением значения заполнителя С40, равного 0 (из набора Регистр 1) в двух последних знаках символа. Кодового слова отказа от фиксации схемы кодирования (Unlatch) также не требуется;

 

c) если остаются два знака символа для кодирования одного оставшегося значения С40 (знака данных), то в первом из двух оставшихся знаков символа (предпоследнем знаке символа) кодируют отказ от фиксации схемы кодирования (Unlatch), а в последнем знаке символа кодируют знак данных по схеме кодирования ASCII (КОИ-7/КОИ-8);

 

d) если остается один знак символа для кодирования одного оставшегося значения С40 (знака данных), то в последнем знаке символа кодируют знак данных по схеме кодирования ASCII (КОИ-7/КОИ-8). Знак отказа от фиксации схемы кодирования (Unlatch) не кодируют, его наличие подразумевается перед последним знаком символа.

 

Во всех остальных случаях либо используют знак отказа от фиксации схемы кодирования (Unlatch) для выхода из схемы кодирования С40 перед окончанием символа, либо применяют символ большего размера для кодирования данных.

 

5.2.5.3 Использование знака верхнего регистра (Upper Shift) в схеме кодирования С40

 

В схеме кодирования С40 знак верхнего регистра (Upper Shift) не является функциональным знаком символики, а используется как знак регистра (Shift) внутри данного кодового набора. Для кодирования знаков расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255 необходимо закодировать три или четыре значения С40 в соответствии со следующими требованиями.

 

Если [десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128] принадлежит основному набору, то используют запись:

 

[1 (значение знака Регистр 2 (Shift))] [30 (значение знака верхнего регистра (UperShift))] [V (десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128)].

 

В противном случае запись приобретает следующий вид:

 

[1 (значение знака Регистр 2)] [30 (значение знака верхнего регистра)] [0, 1 или 2 (значения знаков Регистр 1, 2 или 3)] [V (десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128)].

 

В данных записях число, приведенное в квадратных скобках, соответствует значению согласно приложению С.1, соответствующее значение С40 обозначено V.

 

5.2.6 Схема кодирования Text

 

Схема кодирования Text предназначена для кодирования обычного печатного текста, состоящего в основном из знаков нижнего регистра (строчных букв латинского алфавита, цифр, знака ПРОБЕЛ). По структуре она похожа на кодовый набор, используемый в схеме кодирования С40, за исключением того, что строчные буквы нижнего регистра кодируют напрямую (без переключения регистра). Знаки верхнего регистра (прописные буквы латинского алфавита, цифры, специальные графические знаки и знак ПРОБЕЛ) предваряют знаком регистра 3. Полный кодовый набор знаков схемы кодирования Text приведен в приложении С (таблица С.2).

 

5.2.6.1 Переключение на схему кодирования Text и обратно

 

На схему кодирования Text можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования с десятичным значением 239. Кодовое слово значением 254, непосредственно следующее за парой кодовых слов в схеме кодирования Text, действует как кодовое слово отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). В противном случае схема кодирования Text действует до окончания данных, кодируемых в символе.

 

5.2.6.2 Правила кодирования в схеме кодирования Text

 

Применяют те же правила, что и в схеме кодирования С40.

 

5.2.7 Схема кодирования ANSI X12

 

Схему кодирования ANSI X12 применяют для кодирования знаков, используемых при стандартном электронном обмене данными по ANSI X12, в которой три знака данных размещают с уплотнением в двух кодовых словах и которая в некоторой степени подобна схеме кодирования С40. Схема кодирования ANSI Х12 позволяет кодировать буквы верхнего регистра (прописные латинские буквы), цифры, знак ПРОБЕЛ и три стандартных ограничительных и разделительных знака в соответствии с ANSI X12. Соответствие кодов по ANSI X12 приведено в таблице 4. В наборе кодируемых знаков по ANSI X12 отсутствуют знаки регистра (Shift).

 

 

Таблица 4 - Набор кодируемых знаков по ANSI X12

 

 

 

Значение знака Х12

Кодируемые знаки

Десятичные значения знака ASCII (КОИ-7)

0

Х12 ограничитель сегмента <CR>
 

13

1

Х12 разделитель сегментов * (ЗВЕЗДОЧКА)

42

2

Х12 разделитель подэлементов > (БОЛЬШЕ)

62

3

ПРОБЕЛ

32

4-13

от 0 до 9

48-57

14-39

от А до Z

65-90

 

________________

Управляющий знак CR соответствует обозначению знака ВК "ВОЗВРАТ КАРЕТКИ" по
ГОСТ 27465-87
"Системы обработки информации. Символы. Классификация, наименование и обозначение".
 

5.2.7.1 Переключение на схему кодирования ANSI X12 и обратно

 

На схему кодирования ANSI X12 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования (Latch) (значение 238). Кодовое слово значением 254, непосредственно следующее за парой кодовых слов схемы кодирования ANSI X12, действует как кодовое слово отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). В противном случае схема кодирования ANSI X12 действует до окончания данных, кодируемых в символе.

 

5.2.7.2 Правила кодирования в соответствии со схемой кодирования ANSI X12

 

Применяют правила, установленные для схемы кодирования С40. Исключение составляет окончание кодирования данных ANSI X12. Если знаки данных не полностью заполняют пары кодовых слов, то сразу за последней полной парой кодовых слов следует использовать переключение в схему кодирования ASCII (КОИ-7/КОИ-8) с помощью кодового слова значением 254 и продолжить использование схемы кодирования ASCII (КОИ-7/КОИ-8) за исключением случая, когда остается единственный конечный знак символа (кодовое слово) перед первым кодовым словом исправления ошибки. Этот единственный знак символа кодируется по схеме кодирования ASCII (КОИ-7/КОИ-8) без использования кодового слова отказа от фиксации (Unlatch).

 

5.2.8 Схема кодирования EDIFACT

 

Схема кодирования EDIFACT включает в себя 63 знака КОИ-7 (ASCII) с десятичными значениями от 32 до 94, а также знак отказа от фиксации (двоичное значение 011111) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). Схема кодирования EDIFACT позволяет кодировать четыре знака данных в трех кодовых словах. Знаки данных включают в себя все цифры, буквы латинского алфавита и специальные графические знаки (знаки пунктуации), определенные в наборе знаков "EDIFACT Level А" без знаков регистра (Shift), используемых в схеме кодирования С40.

 

5.2.8.1 Переключение на схему кодирования EDIFACT и обратно

 

На схему кодирования EDIFACT можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования (Latch) значением 240. Знак отказа от фиксации в схеме кодирования EDIFACT следует использовать в качестве ограничителя окончания схемы кодирования EDIFACT для возврата в схему кодирования ASCII (КОИ-7/КОИ-8).

 

5.2.8.2 Правила кодирования в соответствии со схемой кодирования EDIFACT

 

Набор знаков в схеме кодирования EDIFACT приведен в приложении С, таблица С.З. Существует простое соответствие между 6-битовыми значениями знаков по EDIFACT и 8-битовыми байтами знака расширенного набора ASCII (КОИ-8). При построении 6-битового значения знака по EDIFACT исключают два бита старших разрядов 8-битового байта в соответствии с рисунком 3. Строки из четырех знаков со значениями по EDIFACT кодируют в три кодовых слова. В процессе простого кодирования два бита старших разрядов удаляют из 8-битового байта. Оставшийся 6-битовый байт является значением по EDIFACT и должен быть непосредственно закодирован в кодовом слове (рисунок 4).

 

 

 

 

 

Знак данных

 

Значение знака расширенного набора ASCII (КОИ-8)

Значение знака по EDIFACT

 

Десятичное значение

 

8-битовое двоичное значение

 

 

А

65

01000001

000001

9

57

00111001

111001

Примечание - В процессе декодирования, если начальный бит (6-й разряд) равен 1, то для построения 8-битового байта требуется вставить в качестве префикса биты 00. Если начальный бит (6-й разряд) равен нулю, то для построения 8-битового байта надо вставить в качестве префикса биты 01. Исключением является знак со значением по EDIFACT 011111, который является управляющим знаком символики отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8).

 

     

Рисунок 3 - Соответствие значений знаков по EDIFACT и значений 8-битовых байтов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Знаки данных

D

А

Т

А

Исходные двоичные значения (по таблице С.3)

00

01

00

 

00

00

01

 

 

01

01

00

 

 

00

00

01

 

Разделение по три 8-битовых байта

00

01

00

 

 

00

 

00

01

 

01

01

00

 

00

00

01

Итоговые значения кодовых слов

16

21

1

 

     

Рисунок 4 - Пример кодирования по EDIFACT

Когда кодирование EDIFACT завершается знаком отказа от фиксации схемы кодирования (Unlatch), любые биты, оставшиеся в одиночном знаке символа, следует заполнять нулями. Схема кодирования ASCII (КОИ-7/КОИ-8) начинается со следующего знака символа. Если схема кодирования EDIFACT действует до конца символа, и до первого знака исправления ошибки осталось закодировать только одно или два кодовых слова, оставшихся за последним триплетом кодовых слов по схеме кодирования EDIFACT, их следует кодировать по схеме кодирования ASCII (КОИ-7/КОИ-8) без использования знака отказа от фиксации (Unlatch).

 

5.2.9 Схема кодирования по основанию 256

 

Схему кодирования по основанию 256 используют для кодирования любых 8-битовых байтов данных, включая интерпретации в расширенном канале (ECI), и двоичных данных. Интерпретация, используемая по умолчанию, определена в 5.2.2. Алгоритм рандомизации с шаблоном из 255 состояний применяют к каждой последовательности по основанию 256, встречающейся в закодированных данных (приложение В.2). Схема начинает действовать после знака фиксации схемы кодирования по основанию 256 и заканчивается на последнем знаке, определенном длиной поля в схеме кодирования по основанию 256.

 

5.2.9.1 Переключение на схему кодирования по основанию 256 и обратно

 

На схему кодирования по основанию 256 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования значением 231. По окончании данных, закодированных в соответствии со схемой кодирования по основанию 256, возврат к схеме кодирования ASCII (КОИ-7/КОИ-8) осуществляется автоматически. Обращение к интерпретации в расширенном канале (ECI), отличающейся от принятой по умолчанию, должно быть выполнено до переключения на схему кодирования по основанию 256. Последовательность ECI не требуется располагать непосредственно перед переключением в схему кодирования по основанию 256.

 

5.2.9.2 Правила кодирования в соответствии со схемой кодирования по основанию 256

 

После переключения на схему кодирования по основанию 256 первые одно (
) или два (
,
) кодовых слова устанавливают длину поля данных в байтах. Определение степени соответствия между длиной поля и значениями
и
приведено в таблице 5. Далее записываются значения данных в байтах.
 

Таблица 5 - Длина поля в схеме кодирования по основанию 256

 

 

 

Длина поля

Значения
,
 
Допустимые значения
 

До конца символа

0
 
0
 

От 1 до 249

заданная длина
 
от 1 до 249
 

От 250 до 1555

 
(заданная длина DIV 250)+249
 
от 250 до 255
 

 

 

 

заданная длина MOD 250
 
от 0 до 249
 

 

 

      

     

 

      5.3 Рекомендации пользователям

Символика версии ЕСС 200 предлагает гибкие способы кодирования данных. К альтернативным наборам знаков следует обращаться с использованием протокола интерпретации в расширенном канале (ECI). Данные могут быть закодированы в символ квадратной или прямоугольной формы. Если длина сообщения превышает емкость символа, то оно может быть закодировано с использованием последовательности структурированного соединения нескольких (до 16) отдельных, но логически связанных символов версии ЕСС 200 (5.6).

 

5.3.1 Выбор пользователем интерпретации в расширенном канале (ECI)

Использование альтернативной интерпретации в расширенном канале (ECI) для задания определенной кодовой страницы (набора) или более специфичной интерпретации данных требует вызова дополнительных кодовых слов для активизации этой возможности. Использование протокола интерпретации в расширенном канале (ECI) (5.4) обеспечивает возможность кодирования в данных знаков алфавитов, отличающихся от латинского (по ИСО/МЭК 8859-1 Латинский алфавит N 1), поддерживаемого интерпретацией по умолчанию (последовательность ECI 000003).

 

5.3.2 Выбор пользователем формы и размера символа

 

Версия ЕСС 200 имеет двадцать четыре квадратных и шесть прямоугольных конфигураций символа. Можно выбрать подходящий размер и форму символа, в зависимости от требований к его практическому применению; технические требования к данным конфигурациям приведены в 5.5.

 

 

      

 

      5.4 Интерпретация в расширенном канале

Протокол интерпретации в расширенном канале (ECI) позволяет включать в выходной поток данных знаки различных интерпретаций, отличающиеся от набора знаков по умолчанию. Протокол ECI единообразно определен для ряда символик. В символике Data Matrix поддерживаются четыре распространенных типа интерпретаций:

 

a) международные наборы знаков (или кодовые страницы);

 

b) интерпретации общего назначения, такие как шифрование и уплотнение;

 

c) определяемые пользователем интерпретации для замкнутых систем применения;

 

d) управляющая информация для структурированного соединения в небуферизованном режиме.

 

Протокол интерпретации в расширенном канале полностью установлен в стандарте AIM Inc. ITS/04-001 "Интерпретации в расширенном канале. Часть 1" ("International Technical Specification - Extended Channel Interpretation - Parth 1"). Протокол обеспечивает последовательный метод установления специфических интерпретаций значений байтов перед печатью и после декодирования. Конкретную интерпретацию в расширенном канале идентифицируют с помощью 6-разрядного числа, которое в символике Data Matrix кодируют знаком ECI, за которым следует от одного до трех кодовых слов. Специальные интерпретации приведены в документе AIM Inc. "Интерпретации в расширенном канале. Часть 3" ("Extended Chanel Interpretations - Part 3 - Register"). Интерпретация в расширенном канале может использоваться только с устройствами считывания, позволяющими передавать идентификаторы символики. Устройства считывания, которые не могут передавать идентификаторы символики, не обеспечивают передачу данных из любого символа, содержащего ECI. Исключение может быть сделано только в случае, если интерпретация в расширенном канале может быть полностью обработана самим устройством считывания.

 

Протокол интерпретации в расширенном канале используют только в символах версии ЕСС 200. Заданная интерпретация в расширенном канале может быть вызвана в любом месте закодированного сообщения.

 

5.4.1 Кодирование интерпретации в расширенном канале

 

Разнообразные схемы кодирования символики Data Matrix версии ЕСС 200 (таблица 1) могут применяться при любой интерпретации в расширенном канале. Вызов ECI может быть осуществлен только из схемы кодирования ASCII (КОИ-7/КОИ-8), после которого допускается переключение между любыми схемами кодирования. Используемый способ кодирования строго определен 8-битовыми значениями данных и он не зависит от действующей ECI. Например последовательность знаков с десятичными значениями в диапазоне от 48 до 57 может быть наиболее эффективно закодирована в цифровом режиме, даже если они не будут интерпретироваться как числа. Назначение ECI вводят с помощью кодового слова значением 241 (знак ECI) в схеме кодирования ASCII (КОИ-7/КОИ-8). Одно, два или три дополнительных кодовых слова используют для кодирования номера назначения ECI (ECI Assignment member). Правила кодирования приведены в таблице 6.

 

 

Таблица 6 - Кодирование номеров назначения ECI в символике версии ЕСС 200

 

 

 

 

Номер назначения ECI

Последовательность кодовых слов

Значения кодовых слов

Область значений

От 000000 до 000126

 

241

 

 

 

ЕСI_nо +1*

(от 1 до 127)
 

От 000127 до 016382

 

241

 

 

 

(ЕСI_no - 127)div254+128

(от 128 до 191)
 

 

 

(ЕСI_nо - 127) mod 254+1

(от 1 до 254)
 

От 0016383 до 999999

 

241

 

 

 

(ЕС1_no - 16383)div64516+192

(от 192 до 207)
 

 

 

[(ЕСI_no - 16383) div 254] mod 254+1

(от 1 до 254)
 

 

 

(ЕСI_no - 16383) mod 254+1

(от 1 до 254)
 

 

________________

* ECl_nо +1 - заданный номер назначения ECI.

 

Следующие примеры приведены для иллюстрации кодирования:

 

номер назначения ECI=015000

 

Кодовые слова:

 

[241][(15000-127) div 254+128][(15000-127) mod 254+1]=[241][58+128][141+1]=[241][186][142]

 

номер назначения ECI=090000

 

Кодовые слова:

 

[241][(90000-16383) div 64516+192][((90000-16383) div 254) mod 254+1][(90000-16383) mod 254+1]=[241][1+192][289 mod 254+1][211+1]=[241][193][36][212]

 

5.4.2 ECI и структурированное соединение

 

ECI могут появляться в любом месте сообщения, закодированного в одиночном символе или в символе структурированного соединения (5.6) набора символов Data Matrix. Любая активизированная ECI сохраняет действие либо до конца закодированных данных, либо до появления другой ECI. Таким образом, интерпретация в заданной ECI может распространяться на два или более символов.

 

5.4.3 Протокол после декодирования

 

Протокол передачи данных ECI определен в 11.4. При применении интерпретаций в расширенном канале следует использовать идентификаторы символики (11.5) и соответствующий идентификатор символики должен передаваться перед декодированными данными.

 

 

      

 

      5.5 Атрибуты символа версии ЕСС 200

5.5.1 Размер и емкость символа

 

В символике версии ЕСС 200 доступны 24 квадратных и 6 прямоугольных символов, указанные в таблице 7.

 

 

Таблица 7 - Атрибуты символов ЕСС 200

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Размер*

символа

Область данных

Размер коор-

динат-

ной мат-

рицы

Общее число кодовых слов

Число кодовых слов в блоке Рида-

Соломона

Число чере-

дую-

щихся блоков

Максимальная емкость символа для данных

Кодо-

вые слова исп-

рав-

ле-

ния оши-

бок, %

Мак-

сима-

льное число восста-

новлен-

ных кодовых слов**, ошибок/

сти-

раний

Число строк

Число столб-

цов

Раз-

мер

Чис-

ло об-

лас-

тей дан-

ных

 

дан-

ных

исп-

рав-

ле-

ния оши-

бок

дан-

ных

исп-

рав-

ле-

ния оши-

бок

 

чис-

ло чис-

ло-

вых раз-

ря-

дов

число латин-

ских букв и цифр****

чис-

ло бай-

тов

 

 

Символы квадратной формы

10

10

8x8

1

8x8

3

5

3

5

1

6

3

1

62,5

2/0

12

12

10x10

1

10x10

5

7

5

7

1

10

6

3

58,3

3/0

14

14

12x12

1

12x12

8

10

8

10

1

16

10

6

55,6

5/7

16

16

14x14

1

14x14

12

12

12

12

1

24

16

10

50

6/9

18

18

16x16

1

16x16

18

14

18

14

1

36

25

16

43,8

7/11

20

20

18x18

1

18x18

22

18

22

18

1

44

31

20

45

9/15

22

22

20x20

1

20x20

30

20

30

20

1

60

43

28

40

10/17

24

24

22x22

1

22x22

36

24

36

24

1

72

52

34

40

12/21

26

26

24x24

1

24x24

44

28

44

28

1

88

64

42

38,9

14/25

32

32

14x14

4

28x28

62

36

62

36

1

124

91

60

36,7

18/33

36

36

16x16

4

32x32

86

42

86

42

1

172

127

84

32,8

21/39

40

40

18x18

4

36x36

114

48

114

48

1

228

169

112

29,6

24/45

44

44

20x20

4

40x40

144

56

144

56

1

288

214

142

28

28/53

48

48

22x22

4

44x44

174

68

174

68

1

348

259

172

28,1

34/65

52

52

24x24

4

48x48

204

84

102

42

2

408

304

202

29,2

42/78

64

64

14x14

16

56х56

280

112

140

56

2

560

418

277

28,6

56/106

72

72

16x16

16

64x64

368

144

92

36

4

736

550

365

28,1

72/132

80

80

18x18

16

72x72

456

192

114

48

4

912

682

453

29,6

96/180

88

88

20x20

16

80x80

576

224

144

56

4

1152

862

573

28

112/212

96

96

22x22

16

88x88

696

272

174

68

4

1392

1042

693

28,1

136/260

104

104

24x24

16

96x96

816

336

136

56

6

1632

1222

813

29,2

168/318

120

120

18x18

36

108x108

1050

408

175

68

6

2100

1573

1047

28

204/390

132

132

20x20

36

120x120

1304

496

163

62

8

2608

1954

1301

27,6

248/472

144

144

22x22

36

132x132

1558

620

156

62

8***

3116

2335

1555

28,5

310/590

 

 

 

 

 

 

 

 

 

 

 

 

 

 

155

62

2***

 

 

 

 

 

 

 

 

 

 

Символы прямоугольной формы

8

18

6x16

1

6x16

5

7

5

7

1

10

6

3

58,3

3/0

8

32

6x14

2

6x28

10

11

10

11

1

20

13

8

52,4

5/0

12

26

10x24

1

10x24

16

14

16

14

1

32

22

14

46,7

7/11

12

36

10x16

2

10x32

22

18

22

18

1

44

31

20

45,0

9/15

16

36

14x16

2

14x32

32

24

32

24

1

64

46

30

42,9

12/21

16

48

14x22

2

14x44

49

28

49

28

1

98

72

47

36,4

14/25

* размер символа не включена свободная зона.

 

 

** По 5.7.3.

 

 

*** В символе наибольшего размера (144x144) первые восемь блоков по Риду-Соломону включают в 218 кодовых слов, кодирующих 156 кодовых слов данных. Последние два блока включают 217 кодовых слов (155 слов данных). Все блоки содержат 62 кодовых слова исправления ошибок.

 

 

**** В соответствии с правилами схем кодировании Text или С40 без использования знаков фиксации и регистра; при кодировании с помощью других схем это значение может значительно варьироваться в зависимости от сочетания и группирования наборов знаков.

 

5.5.2 Включение направляющих шаблонов в символы большого размера

 

Согласно таблице 7 символы квадратной формы, размерами (в модулях) 32х32 и более, и четыре прямоугольных символа размерами (в модулях) 8х32, 12х36, 16х36 и 16х48 имеют две или более области данных (data regions). Эти области данных ограничивают направляющими шаблонами (приложение D). Символы квадратной формы делят на 4, 16 или 36 областей данных (приложение D, рисунки D.1, D.2 и D.3). Прямоугольные символы делят на две области данных (приложение D, рисунок D.4). Чередующиеся темные модули направляющего шаблона должны быть расположены на верхней и правой границах области данных и идентифицировать четные столбцы и строки.

                

 

 

      5.6 Структурированное соединение

5.6.1 Основные принципы

 

В структурированном формате может присутствовать до 16 символов версии ЕСС 200 для кодирования сообщения большого объема. Символ является частью структурированного соединения, что отмечается кодовым словом значением 233 в позиции первого знака символа. Непосредственно за ним следуют три кодовых слова структурированного соединения. Первое кодовое слово является индикатором позиции символа в группе, второе и третье предназначены для идентификация файла.

 

5.6.2 Индикатор позиции символа

 

Кодовое слово индикатора позиции символа задает положение конкретного символа внутри группы (до 16) символов версии ЕСС 200 в формате структурированного соединения в виде значения "
из общего числа
символов". Первые четыре бита в данном кодовом слове указывают позицию данного символа как двоичное значение равное (
). Последние 4 бита задают общее число символов, подлежащих объединению в формате структурированного соединения как двоичное значение, равное (
). 4-битовые комбинации должны соответствовать установленным в таблице 8.
 

Таблица 8 - Значения битов позиции символа в структурированном соединении

 

 

 

 

Позиция символа

Значения битов с 1 по 4

Общее число символов

Значения битов с 5 по 8

1

0000

 

 

2

0001

2

1111

3

0010

3

1110

4

0011

4

1101

5

0100

5

1100

6

0101

6

1011

7

0110

7

1010

8

0111

8

1001

9

1000

9

1000

10

1001

10

0111

11

1010

11

0110

12

1011

12

0101

13

1100

13

0100

14

1101

14

0011

15

1110

15

0010

16

1111

16

0001

 

Пример - Порядок кодирования кодового слова индикатора позиции символа для третьего символа в группе из семи символов:

 

Значение битов в третьей позиции символа: 0010

 

Общее число символов 7:1010

 

Комбинация битов: 00101010

 

Значение кодового слова: 42

 

5.6.3 Идентификация файла

 

Идентификацию файла задают значениями двух кодовых слов. Каждое кодовое слово идентификации файла может иметь значение от 1 до 254, что допускает 64516 различных вариантов идентификации файла. Идентификация файла предназначена для повышения вероятности того, что только логически связанные символы обрабатываются как часть единого сообщения.

 

5.6.4 Структурированное соединение и знак FNC1

 

Если структурированное соединение используется в сочетании со знаком FNC1 (5.2.4.6), то первые четыре кодовых слова следует применять для структурированного соединения, а пятое и шестое доступны для использования знака FNC1. Знак FNС1 не должен повторяться в этих же позициях во втором и последующем символах, если только он не используется в качестве разделителя полей.

 

5.6.5 Буферизованные и небуферизованные операции

 

Сообщение, содержащееся в рамках последовательности структурированного соединения, может быть целиком накоплено в буфере устройства считывания до своего полного ввода и передано после того, как считаны все символы. В качестве альтернативы устройство считывания может передавать декодированные данные из каждого символа по мере их считывания. В этой небуферизованной операции протокол ECI для структурированного соединения, установленный в стандарте AIM ITS 04/001, часть 1, определяет управляющий блок, который должен вставляться в качестве префикса перед началом передаваемых данных каждого символа.

 

 

      

 

      5.7 Обнаружение и исправление ошибок

5.7.1 Исправление ошибок Рида-Соломона

 

В символах версии ЕСС 200 используют исправление ошибок Рида-Соломона.

 

Для символов версии ЕСС 200 с общим числом кодовых слов менее 255 кодовые слова исправления ошибки вычисляют с помощью кодовых слов данных без процедуры чередования.

 

Для символов версии ЕСС 200 с общим числом кодовых слов более 255 кодовые слова исправления ошибки вычисляют с помощью кодовых слов данных с использованием процедуры чередования (приложение А). Каждый символ версии ЕСС 200 характеризуется особым числом кодовых слов данных и исправления ошибок, которые разделены в определенном числе блоков (таблица 7) и к которым применяется процедура чередования (приложение А).

 

Полиномиальные арифметические вычисления для символов версии ЕСС 200 должны проводиться с использованием побитового арифметического устройства для битовых операций по модулю 2 и арифметического устройства для байтовых операций по модулю 100101101 (десятичное значение 301). Это поле Галуа 2
, где 100101101 соответствует простому минимальному многочлену поля
. Используют 16 различных порождающих многочленов для вычисления соответствующих кодовых слов исправления ошибок, приведенных в приложении Е, раздел Е.1.
 

5.7.2 Генерация кодовых слов исправления ошибок

 

Кодовые слова исправления ошибок являются остатком отделения кодовых слов данных на полиномиальную функцию
, используемую для кодов Рида-Соломона (приложение Е, раздел Е.1).
 
Примечание - При вычислении полином данных символа сначала должен быть дополнительно умножен на
, после чего проводят деление многочлена на многочлен.
 
Кодовые слова данных являются коэффициентами полинома с коэффициентом при наивысшей степени равным первому кодовому слову данных и с коэффициентом при низшей степени равным последнему кодовому слову данных перед первым кодовым словом исправления ошибок. Коэффициент при наивысшей степени оставшейся части полинома является первым кодовым словом исправления ошибок и коэффициент при нулевой степени является последним кодовым словом исправления ошибок и последним кодовым словом. Это может быть выполнено с помощью схемы деления, приведенной на рисунке 5. Регистры от
до
инициализируют нулями. Существуют две стадии генерации кодирования. На первой стадии при положении ключа в нижней позиции кодовые слова данных передаются как на выход, так и на схему. Первая стадия завершается за
синхронизирующих импульсов. На второй стадии (
,
синхронизирующих импульсов) при положении ключа в верхнем положении, кодовые слова исправления ошибок
,...,
генерируются путем выдачи значений из всех регистров по порядку с сохранением нулевых данных на входе. Кодовые слова на выходе регистра сдвига должны быть расположены в порядке, в котором они будут размещены в символе. При использовании процедуры чередования указанные кодовые слова не будут размещены последовательно в знаках символа (приложение А).
 
Примечание -
и
определены в 3.2 как число кодовых слов данных и число кодовых слов исправления ошибок соответственно.
 
 

Рисунок 5 - Схема генерации кодовых слов исправления ошибки

5.7.3 Возможности исправления ошибок

 

Кодовые слова исправления ошибок позволяют исправлять два типа ошибочных кодовых слов: стирания (ошибочные кодовые слова с известными позициями) и ошибки (ошибочные кодовые слова с неизвестными позициями). Стирание представляет собой не сканированный или не поддающийся декодированию знак символа. Ошибка представляет собой неправильно декодированный знак символа. Число стираний и ошибок, которые одновременно можно исправить, вычисляют по следующей формуле

 

,
 
где
- число стираний;
 
- число ошибок;
 
- число кодовых слов исправления ошибок;
 
- число кодовых слов, зарезервированных для обнаружения ошибок.
 
В общем случае
0. Однако если большая часть возможности исправления ошибок, свойственных коду, используется для исправления стираний, то возрастает возможность необнаружения ошибки. Если число стираний больше половины числа кодовых слов исправления ошибок, то
3. Для символов небольших размеров (10x10, 12x12, 8x18, 8x32) не следует использовать исправление стираний (
0 и
1).
 

      

 

      5.8 Формирование символа

При заданной последовательности кодовых слов, рассмотренной в предыдущих разделах, символ версии ЕСС 200 формируется следующим образом:

a) размещение модулей кодовых слов в координатной матрице;

 

b) подстановка модулей направляющего шаблона, при необходимости;

 

c) размещение модулей шаблона поиска по периметру символа.

 

5.8.1 Размещение знаков символа

 

Каждый знак символа должен включать в себя восемь номинально квадратных модулей, каждый из которых отображает один двоичный разряд. Темный модуль соответствует единице, светлый - нулю. Восемь модулей, упорядоченных слева-направо и сверху-вниз составляют форму знака символа (рисунок 6). Вследствие того, что форма знака символа (рисунок 6) не может точно вписаться в границы символа, некоторые знаки символа разбивают на части. Порядок размещения знаков символа определен программой на языке программирования С (приложение F).

 

 

LSB - младший значащий разряд (Least significant bit); MSB - старший значащий разряд (Most significant bit)

 

Рисунок 6 - Представление кодового слова в знаке символа версии ЕСС 200

5.8.2 Размещение модулей направляющего шаблона (Alinement Pattern)

 

Этот этап применяют только для крупных матриц квадратной формы размерами (в модулях) от 32х32 и более, а также прямоугольной формы размерами (в модулях) от 8х32, 12х36 и более. Для выбранного формата символа координатную матрицу разбивают на области данных размерами, установленными в таблице 7. Области данных отделяют друг от друга направляющими шаблонами шириной два модуля. В результате некоторые знаки символа будут разделены между двумя смежными областями данных. Для матриц квадратной формы направляющие шаблоны размещают между областями данных горизонтально и вертикально парами. Общее число пар направляющих шаблонов 2, 6 или 10 (приложение D, рисунки D.1-D.3). Для матриц прямоугольной формы между областями данных размещают только один вертикальный направляющий шаблон (приложение D, рисунок D.4).

 

5.8.3 Размещение модулей шаблона поиска (Finder Pattern)

 

Для формирования шаблона поиска модули следует размещать по периметру матрицы (4.3.1).

 

 

      

 

      6 Требования к символам версии ЕСС 000-140

 

 

      6.1 Рекомендации по применению

Для разрабатываемых прикладных приложений и открытых систем рекомендуется использовать символику версии ЕСС 200 (раздел 5). Неизвестны случаи, когда символы версии ЕСС 200 были бы менее устойчивыми к повреждениям, чем символы версии ЕСС 000-140 того же размера.

 

 

      

 

      6.2 Порядок кодирования

В настоящем подразделе приведено общее описание порядка кодирования, в следующих подразделах - более подробное описание. Пример кодирования для символа уровня ЕСС 050 приведен в приложении Q.

 

Преобразование данных пользователя в символ версии ЕСС 000-140 проводят в следующем порядке:

 

Этап 1. Кодирование данных

 

Проводят анализ входных данных пользователя для определения совокупности различных типов знаков, подлежащих кодированию. Для максимальной эффективности уплотнения должна быть выбрана оптимальная схема кодирования самого низкого уровня, способная закодировать данные. Если пользователь не устанавливает размер матрицы, то выбирают наименьший размер для размещения данных. Результатом этого этапа является двоичный поток закодированных данных (Encoded Data Bit Stream).

 

Этап 2. Формирование префикса данных

 

Двоичный поток префикса данных формируют из поля идентификатора формата, поля величины контроля циклической избыточности (CRC) и двоичного поля длины данных. Указанный двоичный поток префикса данных добавляют в виде префикса к двоичному потоку закодированных данных для создания незащищенного двоичного потока (Unprotected Data Bit Stream).

 

Этап 3. Обнаружение и исправление ошибок

 

Обрабатывают незащищенный двоичный поток в соответствии с установленным пользователем алгоритмом сверточного кодирования для создания защищенного двоичного потока (Protected Bit Stream). Этот этап не выполняют для символов уровня ЕСС 000.

 

Этап 4. Построение головной и конечной меток

К защищенному двоичному потоку добавляют в виде префикса головную метку, содержащую только двоичное поле контроля и исправления ошибок (ЕСС). К защищенному двоичному потоку присоединяют также конечную метку, содержащую биты-заполнители (нулевые биты). Защищенный двоичный поток, к которому добавлены головная и конечная метки, называют нерандомизированным двоичным потоком (Unrandomised Bit Stream).

 

Этап 5. Шаблонная рандомизация

 

Нерандомизированный двоичный поток обрабатывают с помощью алгоритма рандомизации и создают рандомизированный двоичный поток (Randomised Bit Stream).

 

Этап 6. Размещение модулей в матрице

 

Модули размещают в матрице так, чтобы образовался шаблон поиска. Рандомизированный двоичный поток размещают в матрице помодульно в соответствии с алгоритмом размещения модулей данных (приложение Н). Различные двоичные потоки в процессе кодирования приведены на рисунке 7.

 

     

 

Рисунок 7 - Двоичные потоки в процессе кодирования символов версии ЕСС 000-140

 

      

     

 

      6.3 Кодирование данных

Данные должны быть закодированы с использованием одной из шести схем кодирования (таблица 9). Схему кодирования устанавливают для всего символа, поэтому выбор наиболее подходящей схемы кодирования может значительно влиять на число битов, необходимых для кодирования исходных данных. Одни и те же данные могут быть представлены в символах версии ЕСС 000-140 различными способами путем использования различных схем кодирования. Наборы знаков для всех схем кодирования, за исключением схемы с 8-битовыми байтами, приведены в приложении I. Схему кодирования с 8-битовыми байтами определяет пользователь. Наиболее эффективной схемой кодирования для использования является схема с наименьшим основанием, с помощью которой можно закодировать все знаки сообщения. Таким образом, если все знаки могут быть закодированы по схеме кодирования по основанию 27, неэффективно использовать схемы кодирования по основаниям 37 и 41 или схему кодирования ASCII (КОИ-7/КОИ-8).

 

Таблица 9 - Схемы кодирования для символов версии ЕСС 000-140

 

 

 

Схема кодирования

Знаки

Число битов на один знак

По основанию 11

Цифровые данные

3,5

По основанию 27

Прописные буквы

4,8

По основанию 37

Прописные буквы и цифры

5,25

По основанию 41

Прописные буквы, цифры и специальные графические знаки

5,5

ASCII (КОИ-7)

Полный набор 128 знаков ASCII (КОИ-7)

7

8-битовый байт

Определяются пользователем

8

 

Чтобы определить наиболее подходящую схему кодирования, необходимо проанализировать данные, предназначенные для кодирования. Наборы знаков каждой из схем кодирования с основанием N необходимо последовательно сравнивать с набором знаков, подлежащих кодированию, начиная с набора знаков схемы кодирования по основанию 11. Если данный набор знаков подходит, то следует использовать именно его, если нет, то сравнение должно быть продолжено для наборов знаков схем кодирования по основаниям 27, 37 и 41 до тех пор, пока не будет определена подходящая схема с наименьшим числом в основании. Если знаки данных выходят за пределы возможностей набора знаков схемы кодирования по основанию 41, то необходимо использовать набор знаков ASCII (КОИ-7), пока знаки не выходят за установленные пределы, в противном случае следует использовать набор 8-битовых байтов.

 

Для всех схем кодирования каждую уплотненную последовательность от 4 до 24 битов длиной размещают в двоичном потоке закодированных данных в обратном порядке, начиная с самого младшего двоичного разряда в первой позиции, т.е. формируют каждую отдельную уплотненную последовательность, затем порядок меняют на обратный и добавляют в двоичный поток закодированных данных, т.е. формируют полный уплотненный двоичный поток, который затем (как целое) меняет порядок на обратный.

 

Подробности каждой схемы кодирования приведены в следующих подпунктах.

 

6.3.1 Схема кодирования по основанию 11 - кодирование цифр

 

В схеме кодирования по основанию 11 (цифры) кодируют шесть знаков данных как 21 бит с плотностью кодирования 3,5 битов на один знак данных. Кодируемый набор знаков схемы кодирования по основанию 11 позволяет кодировать следующие 11 знаков:

 

- цифры от 0 до 9;

 

- знак ПРОБЕЛ.

 

Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 11 в соответствии с приложением I. На втором этапе должно быть произведено уплотнение кодовых значений по основанию 11 путем преобразования от схемы кодирования по основанию 11 к схеме кодирования по основанию 2 (приложение I, раздел I.1).

 

6.3.2 Схема кодирования по основанию 27 - кодирование прописных букв

 

В схеме кодирования по основанию 27 (прописные буквы) кодируют пять знаков данных в 24 битах с плотностью кодирования 4,8 битов на один знак данных. Кодируемый набор знаков по основанию 27 позволяет кодировать следующие 27 знаков:

 

- прописные латинские буквы от А до Z;

 

- знак ПРОБЕЛ.

 

Кодирование данных проводят в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 27 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 27 путем преобразования от схемы кодирования по основанию 27 к схеме кодирования по основанию 2 (приложение I, раздел I.2).

 

6.3.3 Схема кодирования по основанию 37 - кодирование прописных букв и цифр

 

В схеме кодирования по основанию 37 (прописные буквы и цифры) кодируют четыре знака данных в 21 бите с плотностью кодирования 5,25 битов на один знак данных. Кодируемый набор знаков по основанию 37 позволяет кодировать следующие 37 знаков:

 

- прописные латинские буквы от А до Z;

 

- цифры от 0 до 9;

 

- знак ПРОБЕЛ.

 

Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 37 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 37 путем преобразования от схемы кодирования по основанию 37 к схеме кодирования по основанию 2 (приложение I, раздел I.3).

 

6.3.4 Схема кодирования по основанию 41 - кодирование прописных букв, цифр и специальных графических знаков

 

В схеме кодирования по основанию 41 (прописные буквы, цифры и специальные графические знаки) кодируют четыре знака данных в 22 битах с плотностью кодирования 5,5 битов на один знак данных. Кодируемый набор знаков по основанию 41 позволяет кодировать следующий 41 знак:

 

- прописные латинские буквы от А до Z;

 

- цифры от 0 до 9;

 

- знак ПРОБЕЛ;

 

. (ТОЧКА);

 

, (ЗАПЯТАЯ);

 

- (МИНУС или ДЕФИС);

 

/ (ДРОБНАЯ ЧЕРТА).

 

Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 41 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 41 путем преобразования от схемы кодирования по основанию 41 к схеме кодирования по основанию 2 (приложение I, раздел I.4).

 

6.3.5 Схема кодирования ASCII (КОИ-7)

 

В схеме кодирования ASCII (КОИ-7) кодируют все 128 знаков по ИСО/МЭК 646*. Каждый знак данных кодируют как 7-битовый байт, эквивалентный десятичному значению, приведенному в приложении I, таблице I.1, графе ASCII (КОИ-7).

________________

* Набор знаков по ANSI INCITS 4-1986 (R2007) Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII) (Информационные системы - Кодированные наборы знаков - 7-битовый американский национальный стандартный код для обмена информацией (7-битовый ASCII).

 

6.3.6 Схема кодирования 8-битовыми байтами

 

Схему кодирования 8-битовыми байтами используют в замкнутых прикладных системах, где интерпретацию данных определяет пользователь. Каждый знак данных должен кодироваться как 8-битовый байт.

 

 

      

 

      6.4 Выбор пользователем уровня исправления ошибок

6.4.1 Выбор уровня исправления ошибок

 

Символы версии ЕСС 000-140 предлагают пять уровней исправления ошибок на основе использования сверточных кодов (таблица 10). В прикладных системах применения важно понимать, что повышение уровня исправления ошибок приводит к пропорциональному увеличению числа битов в выходном сообщении (и, следовательно, к увеличению размера символа) и обеспечивает различные уровни исправления ошибок.

 

Таблица 10 - Уровень исправления ошибок, уровень повреждений и увеличение числа битов

 

 

 

Уровень кода исправления ошибок

Максимально возможный уровень повреждений, %

Увеличение числа битов пользователя к ЕСС 000, %

000

Отсутствует

Отсутствует

050

2,8

33

080

5,5

50

100

12,6

100

140

25

300

 

6.4.2 Прочие уровни исправления ошибок на основе алгоритмов сверточных кодов

 

До публикации настоящего стандарта в Data Matrix в прикладных применениях использовались иные уровни исправления ошибок, основанные на алгоритмах сверточного кодирования. Информация нетиповых уровнях исправления ошибок доступна в AIM Inc. Символы с подобными уровнями исправления ошибок не соответствуют требованиям настоящего стандарта.

 

 

      

 

      6.5 Формирование незащищенного двоичного потока

На рисунке 7 показано, что незащищенный двоичный поток имеет префикс данных двоичного потока в виде префикса к кодированным битам данных. Определения составляющих частей префикса данных двоичного потока приведены в следующих пунктах.

 

6.5.1 Двоичное поле идентификатора формата

 

Идентификатор формата определяет схему кодирования данных. Идентификатор формата имеет десятичное значение для целей определения и 5-битовую величину сегмента для кодирования (таблица 11).

 

Таблица 11 - Кодирование идентификатора формата

 

 

 

Идентификатор формата

Схема кодирования

Значение 5-битового сегмента

 

 

 

 

MSB LSB

1

По основанию 11

00000

2

По основанию 27

00001

3

По основанию 41

00010

4

По основанию 37

00011

5

ASCII (КОИ-7)

00100

6

8-битовых байтов

00101

 

6.5.2 Двоичное поле контроля циклической избыточности (CRC)

 

Двоичное поле контроля циклической избыточности (CRC) генерируют с помощью алгоритма CRC. Значение CRC генерируется перед началом кодирования из исходных данных пользователя, представленных в виде 8-битовых байтов, и поэтому используется для независимого контроля ошибок данных пользователя. Полное описание процедуры генерирования значения CRC приведено в приложении J.

 

6.5.3 Двоичное поле длины данных

 

Двоичное поле длины данных имеет размер 9 битов и представляет в двоичном виде число кодируемых знаков данных пользователя.

 

6.5.4 Построение префикса данных

 

Двоичный поток префикса данных имеет длину 30 битов и формируется в соответствии с рисунком 8.

 

 

Рисунок 8 - Структура префикса двоичного потока данных

          

Примечание - Некоторые двоичные поля начинаются с самого старшего разряда (MSB), другие - с самого младшего разряда (LSB).

 

6.5.5 Завершение незащищенного двоичного потока данных

Кодированные двоичные данные добавляют в качестве суффикса к двоичному потоку префикса данных для формирования незащищенного двоичного потока данных.

 

 

      

 

      6.6 Построение нерандомизированного двоичного потока

Нерандомизированный двоичный поток состоит из трех составных частей (рисунок 7):

 

a) головной метки;

 

b) защищенного двоичного потока;

 

c) конечной метки.

 

Формирование указанных составных частей проводят в соответствии с требованиями, приведенными в следующих пунктах.

 

6.6.1 Построение головной метки

 

Головная метка нерандомизированного двоичного потока содержит двоичное поле кода исправления ошибок (ЕСС), которое определяет структуру сверточного кода, используемого для защиты данных, закодированных в символе. Двоичное поле кода исправления ошибок (ЕСС) имеет в длину 7 или 19 битов (таблица 12).

 

 

Таблица 12 - Двоичное поле кода исправления ошибок (ЕСС)

 

 

 

 

 

Уровень кода исправления ошибок

Идентификатор двоичного сегмента

 

 

MSB

LSB

 

000

1111110

 

050

0001110000000001110

 

080

1110001110000001110

 

100

1111111110000001110

 

140

1111110001110001110

 

 

6.6.2 Применение сверточного кодирования для создания защищенного двоичного потока

 

Необходимо выбрать один из пяти уровней исправления ошибок. Критерии выбора приведены в 6.4. Для символа уровня ЕСС 000 не применяют ни один из уровней исправления ошибок, поэтому незащищенный двоичный поток автоматически становится защищенным двоичным потоком. Для прочих четырех уровней исправления ошибок применяют сверточное кодирование, что приводит к увеличению места, занимаемого входными данными, пропорционально по всей длине. Обработка незащищенного двоичного потока на соответствующем конечном автомате исправления ошибок и считывание результата должны создавать кодированный двоичный поток. Схемы четырех конечных автоматов для символов версии ЕСС 050-140 приведены в приложении К.

 

6.6.3 Построение конечной метки

 

К защищенному двоичному потоку добавляют конечную метку, содержащую биты-заполнители (нули). Биты-заполнители должны быть добавлены в конец двоичного потока для обеспечения того, чтобы квадратный корень общего числа битов в нерандомизированном двоичном потоке был равен нечетному целому числу в интервале от 7 до 47. Эта процедура обеспечивает квадратную форму символа.

 

6.6.4 Построение нерандомизированного двоичного потока

 

Защищенный двоичный поток с головной и конечной метками называют нерандомизированным двоичным потоком (рисунок 7).

 

 

      

 

      6.7 Шаблонная рандомизация

Нерандомизированный двоичный поток обрабатывают с применением алгоритма шаблонной рандомизации, в результате чего возникает рандомизированный двоичный поток. Алгоритм шаблонной рандомизации включает в себя операцию поразрядного исключающего ИЛИ (XOR), приложенную к нерандомизированному двоичному потоку по всей его длине, и образцу рандомизации двоичного потока (приложение L), начиная с позиции самого старшего двоичного разряда (MSB).

 

 

      

 

      6.8 Размещение модулей в матрице

Размер сторон сетки модулей данных должен быть равен нечетному числу (от 7 до 47), вычисляемому как квадратный корень согласно 6.6.3. Рандомизированный двоичный поток размещают в матрице модуль за модулем в соответствии с сеткой размещения модулей данных (приложение Н). Шаблон поиска (4.3.1) должен быть размещен так, чтобы образовывать внешние границы сетки модулей данных.

 

 

      

 

      7 Размеры символов

 

 

      7.1 Размеры

Размеры символов Data Matrix должны соответствовать следующим требованиям:

 

размер X - размер модуля должен быть установлен в стандарте по применению с учетом методов сканирования и технологии нанесения символа;

 

шаблон поиска - ширина шаблона поиска должна быть равна размеру X,

 

направляющий шаблон - ширина направляющего шаблона должна быть равна 2Х,

 

свободная зона - минимальный размер свободной зоны вокруг символа Data Matrix должен быть равен размеру X со всех четырех сторон. Для прикладных систем, в которых необходимо уменьшить влияние областей, расположенных в непосредственной близости от символа, создающих повышенные отражающие помехи, рекомендуется оставлять свободную зону размером от 2Х до 4Х.

 

 

      

 

      8 Качество печати символов

Качество печати символов Data Matrix должно оцениваться в соответствии с требованиями, установленными в ИСО/МЭК 15415 с учетом дополнений и изменений, приведенных в настоящем разделе.

 

Некоторые методы маркировки не позволяют наносить символы, полностью соответствующие требованиям настоящего стандарта, без применения специальных мер. Дополнительные рекомендации по адаптации любой системы печати для производства требуемых символов Data Matrix приведены в приложении Т.

 

 

      

 

      8.1 Параметры качества символа

8.1.1 Повреждение фиксированного шаблона

 

Методы измерения и оценки параметра повреждения фиксированного шаблона установлены в приложении М.

 

Примечание - Согласно ИСО/МЭК 15415 (приложение А) измерения и величины, установленные в приложении М настоящего стандарта, приведены взамен установленным в ИСО/МЭК 15415 (приложение А).

 

8.1.2 Качество сканирования и полный класс символа

 

Класс качества сканирования определяют как наименьшую величину из классов отдельных параметров - контраста, модуляции, повреждения фиксированного шаблона, декодирования, осевой неоднородности, неоднородности сетки модулей и неиспользованного исправления ошибок для отдельного изображения символа. Полный класс символа вычисляют как среднеарифметическое значение отдельных классов качества сканирования для нескольких тестовых изображений символа.

 

8.1.3 Неоднородность сетки

 

Идеальную сетку модулей рассчитывают с использованием четырех угловых точек реальной полученной сетки для каждой области данных и разделением ее на одинаковые ячейки по обеим осям.

 

8.1.4 Декодирование

 

Для получения класса декодирования следует использовать рекомендуемый алгоритм декодирования (раздел 9). Неспособность рекомендуемого алгоритма декодирования успешно декодировать символ оценивают как класс декодирования 0.

 

 

      

 

      8.2 Измерения в процессе контроля

Для проведения необходимых измерений с целью мониторинга и контроля процесса производства символов Data Matrix используют средства и методы, описанные в приложении R. Указанные методы не позволяют точно оценить качество печати нанесенных символов (дополнительные рекомендации приведены выше в этом пункте, а также в приложении М), но использование каждого метода по отдельности и всех вместе может быть рекомендовано для производства надлежащих символов в процессе их печати.

 

      

 

      9 Рекомендуемый алгоритм декодирования для символики Data Matrix           

Данный рекомендуемый алгоритм декодирования
позволяет находить на изображении символы Data Matrix и производить их декодирование следующим образом:
 

_______________

Разработаны и иные алгоритмы декодирования с аналогичными функциями.
 

а) определяют значения параметров размеров и формируют цифровое изображение:

 

1) задают расстояние
, равное 7,5 диаметра апертуры, заданной в системе применения, которое считают минимальной длиной стороны L-образного шаблона поиска;
 
2) задают расстояние
, равное 7,5 диаметра апертуры. Это расстояние считают максимальным промежутком в L-образном шаблоне поиска, допускаемым алгоритмом поиска на этапе b);
 
3) задают расстояние
, равное 1,25 диаметра апертуры, которое считают номинальным наименьшим размером модуля, когда размер апертуры составляет 80% размера
символа;
 

4) формируют черно-белое изображение, используя порог, определенный по методике, установленной в ИСО/МЭК 15415;

 

б)* осуществляют поиск горизонтальной и вертикальной линий сканирования для двух внешних L-образных границ Data Matrix:

 

1) продлевают горизонтальную линию сканирования по обе стороны от центральной точки изображения и, следуя вдоль этой линии, находят все точки перехода черное/белое и белое/черное. Для каждой точки перехода, найденной на линии сканирования и приведенной к границе пикселя (называемой далее точкой старта), производят следующее:

 

i) следуют от точки старта вверх вдоль границы перехода черный - белый, пиксель за пикселем до точки, расположенной на расстоянии
от точки старта, или до той точки, в которой линия границы поворачивает вниз;
 
ii) следуют от точки старта вниз вдоль границы перехода черный - белый, пиксель за пикселем до точки, расположенной на расстоянии
от точки старта, или до той точки, в которой линия границы поворачивает вверх;
 
iii) если при движении вверх достигли точки, отстоящей на
от точки старта:
 

I) проводят линию А, соединяющую конечные точки вертикальной границы перехода;

 

II) проверяют, чтобы отклонение промежуточных точек границы от прямой линии А находилось в пределах
. Если это условие выполняется, то продолжают выполнение с этапа, указанного в перечислении III). В противном случае переходят к выполнению этапа, указанного в перечислении 1) iv), до достижения края границы перехода в противоположное направление;
 
III) продолжают следовать вверх вдоль границы перехода до расстояния
от линии А. Возвращаются в ближайшую точку границы перехода, находящуюся на расстоянии, большем или равном
от последней точки границы перехода вдоль линии границы перехода и сохраняют ее как конечную точку границы перехода. Эту точку следует рассматривать как одно из предполагаемых положений границ внешнего края L-образных границ;
 
IV) продолжают следовать вниз вдоль границы перехода до расстояния
от линии А. Возвращаются в ближайшую точку границы перехода, находящуюся на расстоянии, большем или равным
от последней точки границы перехода вдоль линии границы перехода и сохраняют ее как конечную точку границы перехода. Эта точка должна быть расположена на предполагаемой границе перехода, и ее следует рассматривать как одно из предполагаемых положений границы внешнего края L-образных границ;
 

V) вычисляют новую откорректированную линию А1, которая является "наиболее приближенной" линией для границы перехода, определенной на двух предыдущих этапах. "Наиболее приближенную" линию вычисляют с использованием алгоритма линейной регрессии (используя конечные точки для выбора зависимой оси, то есть если они ближе к горизонтальной оси, зависимая ось - ось х) для каждой точки. На "наиболее приближенной" прямой линии отмечают отрезок, ограниченный точками p1 и р2, которые являются ближайшими к найденным выше конечным точкам границы перехода;

 

VI) сохраняют две конечные точки отрезка линии А1 - p1 и р2. Также сохраняют значение цвета левой стороны края границы перехода, видимое при движении от p1 к р2;

 

iv) если этап, указанный в перечислении iii), закончился неудачей или невозможно продолжить движение вниз на
на этапе, указанном в перечислении iii) IV), проверяют, достигнута ли снизу граница перехода на расстоянии
от точки старта. Если да, повторяют операции этапа, указанные в перечислении iii), но не вверх, а вниз;
 
v) если этапы, указанные в перечислениях iii) и iv), закончились неудачей, проверяют, находятся ли верхняя и нижняя границы перехода на расстоянии не менее
от точки старта. Если достигнуты верхняя и нижняя границы перехода, то включают в формируемую границу перехода сегменты вверх и вниз на расстоянии
и повторяют операции этапа, указанные в перечислении iii), но с добавлением границы перехода;
 

vi) повторяют вышеуказанный процесс для следующей точки перехода на линии сканирования, начиная с этапа, указанного в перечислении i), до достижения края изображения;

 

2) проводят линию сканирования вертикально в обоих направлениях от центральной точки изображения. Находят отрезки линий с использованием той же логической процедуры, что и на этапе, указанном в пункте 1), одновременно следуя от каждой границы перехода символа влево, а затем вправо;

 

3) среди сохраненных отрезков линий А1 осуществляют поиск пар отрезков, удовлетворяющих следующим четырем условиям:

 

i) если два отрезка имеют одно и то же направление от p1 до р2, проверяют, что расстояние от точки p1 одного отрезка до точки р2 другого отрезка менее, чем
; если противоположное, то проверяют, что расстояние между точками p1 и p1 или между точками р2 и р2 разных отрезков менее, чем
;
 

ii) два вышеуказанных отрезка должны быть параллельными с отклонением не более 5°;

 

iii) два вышеуказанных отрезка должны быть одного цвета, если отрезки имеют одинаковое направление от p1 к р2, или противоположного цвета, если направления этих отрезков противоположны;

 

iv) формируют две временные линии, продолжая каждый из двух рассматриваемых отрезков по достижении на их продолжениях точки, ближайшей к конечной точке отрезка другой линии. Проверяют, чтобы обе временные линии были отделены менее чем на
от любой иной точки каждой линии;
 

4) для каждой пары линий, соответствующих требованиям этапа, указанного в перечислении 3), заменяют эту пару отрезков линий на один удлиненный отрезок линии А1 путем выбора "наиболее приближенной" линии по четырем конечным точкам пары рассматриваемых коротких отрезков линий. Также запоминают значение цвета левой стороны границы перехода новой удлиненной линии, рассматриваемой от конечной точки p1 до конечной точки р2;

 

5) повторяют этапы, указанные в перечислениях 3) и 4), до тех пор, пока возможно комбинировать пары линии А1;

 

6) выбирают отрезки линии длиннее
. Помечают эти линии как предполагаемые L-образные стороны;
 

7) находят среди полученных пар предполагаемых L-образных сторон две линии, которые должны соответствовать следующим трем критериям:

 

i) ближайшие точки этих линий должны находиться друг от друга на расстоянии менее
;
 

ii) эти две линии должны быть взаимно перпендикулярны с погрешностью до 5°;

 

iii) внутренняя сторона угла, образованного этими линиями, должна иметь один и тот же цвет.

 

Следует иметь в виду, что если одна или обе линии простираются в обе стороны от точки их пересечения, то два или четыре образованных L-образных шаблона должны быть проверены на соответствие цвету и минимальной длине
для укороченной стороны или сторон, прежде чем они могут стать предполагаемыми L-образными границами;
 

8) для каждой пары отрезков - предполагаемых L-образных границ, найденных на этапе, указанном в перечислении 7), формируют предполагаемую L-образную структуру путем продления отрезков до точки их пересечения;

 

9) если предполагаемая L-образная структура была сформирована из отрезков линий белого цвета внутри угла L-образной структуры, формируют инвертированное по цвету изображение для декодирования. Предпринимают попытки декодировать символ, начиная с нормального или инвертированного изображения, выбирая в качестве начального этап, указанный в перечислении d), используя каждую предполагаемую L-образную структуру, определенную на этапе, указанном в перечислении 8), как L-образный шаблон поиска. Если декодирование не удалось выполнить, переходят к этапу, указанному в перечислении с);

 

c) продолжают подбирать отрезки линий А1 и предполагаемые L-образные структуры аналогично предыдущим этапам, также продолжают поиски предполагаемых L-образных структур, используя горизонтальное и вертикальное смещение линий сканирования по отношению к предыдущим линиям сканирования:

 

1) используя новую горизонтальную линию сканирования, проведенную на расстоянии
выше от центральной горизонтальной линии, повторяют в том же порядке действия этапа, указанного в пункте b) 1), исключая действия, при которых процесс начинается из центральной точки изображения, и этапы, указанные в перечислениях от b) 3) до b) 9). Если декодирование не удалось выполнить, переходят к следующему этапу;
 
2) используя новую вертикальную линию сканирования, проведенную на расстоянии
слева от центральной вертикальной линии сканирования, повторяют действия этапа, указанного в перечислении b) 2), исключая действия, при которых процесс начинается из центральной точки изображения, и этапы, указанные в перечислении от b) 3) до b) 9). Если декодирование не удалось выполнить, переходят к следующему этапу;
 
3) повторяют действия этапа, указанного в перечислении 1) выше, используя новую горизонтальную линию сканирования, расположенную на расстоянии
ниже центральной горизонтальной линии сканирования. Если декодирование не удалось выполнить, повторяют действия этапа, указанного в перечислении 2), но со сдвигом новой вертикальной линии сканирования на
вправо от центральной вертикальной линии сканирования. Если декодирование не удалось выполнить, переходят к этапу, указанному в перечислении 4);
 
4) продолжают производить горизонтальные и вертикальные линии сканирования, как это предусмотрено на этапах, указанных в перечислениях 1) - 3), на
вверх, затем влево, затем вниз, затем вправо от ранее произведенных линий сканирования до успешного декодирования символа или до достижения края изображения;
 

d) первоначально считают, что область-кандидат содержит символ квадратной формы. Если декодировать область как символ квадратной формы не удается, пытаются найти и декодировать символ прямоугольной формы, начиная с этапа, указанного в перечислении j). Для символа квадратной формы сначала формируют нормализованную схему переходов для равных сторон области-кандидата, чтобы найти шаблон поиска с чередующимися модулями:

 

1) проводят через область-кандидат линию, делящую пополам внутренний угол, образованный L-образными сторонами (рисунок 9). Определяют две равные области, образованные этой разделительной линией (биссектрисой), как левую и правую области со стороны угла L-образной структуры;

 

2) для каждой области формируют так называемую линию поиска, расположенную на расстоянии
от вершины угла L-образной структуры и параллельную другой ее стороне, и продолжают эту линию до биссектрисы согласно рисунку 9;
 
3) сдвигают каждую линию поиска от вершины угла L-образной структуры (рисунок 9), удлиняя каждую линию поиска, чтобы они всегда начинались от стороны угла L-образной структуры и заканчивались на биссектрисе, сохраняя линии поиска параллельными противоположным сторонам угла L-образной структуры. Каждый раз, когда линия поиска сдвигается на один пиксель изображения, подсчитывают число переходов от черного к белому и от белого к черному, начиная и заканчивая подсчет с перехода от цвета стороны L-образной структуры к противоположному цвету. Подсчет переходов следует делать только тогда, когда линия поиска имеет те же самые цвета, что и две линии непосредственно выше и ниже (левее и правее) текущей, и отличается по цвету от предыдущей линии поиска, для которой такой подсчет делался. Вычисляют величину
как число переходов, умноженное на длину наибольшей стороны L-образной структуры и разделенное на текущую длину линии поиска, измеренную между двумя граничными линиями:
 
(число переходов)
(максимальная длина стороны L-образной структуры)/(длина линии поиска).
 
Эта формула нормализует значение
, предупреждая его увеличение по мере увеличения длины линии поиска.
 
Продолжают вычислять значения
до тех пор, пока линия поиска не будет длиннее наибольшей оси предполагаемой области-кандидата символа на 50%;
 
 

Рисунок 9 - Направления движения линий поиска

 

4) строят график зависимости
для каждой стороны (области), где на оси ординат
указано значение
, а на оси абсцисс
- расстояние линии поиска от вершины угла L-образной структуры. Пример графика приведен на рисунке 10;
 
 

     

Рисунок 10 - Пример графика зависимости
от увеличения длины линии поиска
 
5) рассматривают график
для правой стороны (области), начиная с наименьших значений по оси
, с постепенным увеличением значений
по этой оси. Находят первое место резкого падения значения на графике
, где значение
(
- максимальное значение одной из двух величин - ноль и
) менее 15% значения
в местном локальном максимуме (при условии, что
более 1). Увеличивают это значение
, пока значение
не перестанет уменьшаться. Если в следующей точке значение
не увеличивается, то увеличивают значение
еще раз. Отмечают это значение
как соответствующее впадине. Увеличивают значение
для поиска локального максимума до тех пор, пока число переходов не станет уменьшаться. Отмечают это значение
как соответствующее пику. Значение
ровно посередине между
для впадины и
для пика называют
линии убывания. Линия поиска в точке пика может соответствовать стороне чередующегося шаблона поиска противоположной области. Линия поиска во впадине может соответствовать внутренней части однородной темной линии или светлой свободной зоне;
 
6) находят пик и впадину на графике для левой стороны (области),
линии убывания которых в наибольшей степени подходят по координате
линии убывания пика и впадины на графике для правой стороны (области). При возвращении к этому этапу от этапов, указанных ниже, рассматривают дополнительные пики и впадины левой области в порядке увеличения расстояния от пиков и впадин правой области. Однако должны быть просмотрены все пики и впадины левой области, чтобы гарантировать, что разница между значениями
для пиков правой и левой области менее чем на 15% отличается от среднего значения
для двух пиков и что разница между значениями
для впадин правой и левой области менее чем на 15% отличается от среднего значения
для двух впадин. Значение, равное 15%, соответствует максимально разрешенному сокращению;
 

7) линия поиска, соответствующая впадине на графике для правой стороны, линия поиска, соответствующая впадине на графике для левой стороны, и две стороны угла L-образной структуры очерчивают возможную область данных символа. Проводят обработку этой области данных согласно этапу, указанному в перечислении е). Если декодирование выполнено неудачно, бракуют значения для пика и впадины на графике для левой области и продолжают поиск, начиная с этапа, указанного в пункте d) 6), для следующего пика и впадины. Если все пики и впадины левой области были забракованы, бракуют значения для пика и впадины на графике для правой области и продолжают поиск, начиная с этапа, указанного в пункте d) 5), для следующего пика и впадины;

 

е) для каждой из двух сторон чередующегося шаблона находят линию, проходящую через центры чередующихся темных и светлых модулей:

 

1) для каждой стороны формируют прямоугольную область, ограниченную линиями поиска для пика и впадины как двумя длинными сторонами прямоугольной области и стороной L-образной структуры и линией для впадины для другой стороны как короткими сторонами прямоугольной области (рисунок 11);

 

Рисунок 11 - Построение прямоугольной области

 

2) в пределах этой прямоугольной области находят пары границ между пикселями на стороне с "зубцами":

 

i) проводят контрольные линии, параллельные линии впадины, первая из которых совпадает с этой линией, и определяют все переходы цвета в направлении, перпендикулярном к контрольным линиям. Выбирают только переходы от темного к светлому или от светлого к темному, где первый цвет соответствует преобладающему цвету на изображении вдоль линии впадины;

 

ii) если число найденных цветовых переходов менее, чем 15% числа пикселей, составляющих линию впадины, и контрольная линия не является линией пика, сдвигают контрольную линию в сторону линии пика приблизительно на один пиксель и повторяют действия этапа, указанного в перечислении i), рассматривая новые переходы в дополнении к уже найденным. Если выполнено условие наличия 15% числа цветовых переходов к числу пикселей или достигнута линия пика, переходят к следующему этапу; иначе продолжают поиск, начиная с пункта d) 6) для следующих пиков и впадин левой области;

 

iii) вычисляют предварительную "наиболее приближенную линию" с помощью алгоритма линейной регрессии, используя точки на границах между выбранными парами пикселей;

 

iv) отбрасывают 25% точек, наиболее отдаленных от предварительной "наиболее приближенной линии". Вычисляют окончательную "наиболее приближенную линию" с помощью алгоритма линейной регрессии с использованием оставшихся 75% точек. Эта линия должна проходить вдоль внешней стороны чередующегося шаблона и указана на рисунке 12 как "наиболее приближенная" линия;

 

3) для каждой прямоугольной области строят линию, параллельную линии, определенной на этапе, указанном в перечислении е) 2), смещенную в сторону вершины угла L-образной структуры на длину "пиковой" линии поиска, разделенную на удвоенное число переходов на этой линии поиска:

 

Смещение (
Offset
) = длина линии пика/((число переходов)+1)
2).
 

Каждая из этих двух построенных линий должна соответствовать линии, проведенной через середины модулей внешнего или внутреннего чередующегося шаблона для этой стороны (рисунок 12).

 

Рисунок 12 - Линия центров модулей чередующегося шаблона

 

f) для каждой стороны определяют расстояние от края до края в чередующемся шаблоне:

 

1) ограничивают линию, проходящую через центры модулей чередующегося шаблона, сформированную на этапе, указанном в перечислении е) 3), с одной стороны границей L-образной структуры, а с другой стороны - средней линией чередующегося шаблона, определенной на этапе, указанном в перечислении е) 3). Длину этой линии обозначают
(рисунок 11);
 

2) вдоль ограниченной средней линии измеряют расстояния от края до края между всеми подобными границами всех двухэлементных пар, то есть пар элементов темный/светлый и светлый/темный.

 

Измерения начинаются и заканчиваются с границы перехода от цвета стороны L-образной структуры к противоположному цвету;

 

3) вычисляют среднее арифметическое значение всех измерений расстояний от края до края и устанавливают текущую оценку расстояния от края до края
как это среднее;
 
4) бракуют все пары элементов, у которых измеренные расстояния от края до края отличаются более чем на 25% от
;
 

g) для каждой стороны находят центральные точки модулей в чередующемся шаблоне:

 

1) используя измеренные расстояния пар элементов, не забракованные на этапе, указанном в пункте f) 4), вычисляют среднее приращение ширины темного элемента (штриха) при печати (по вертикали или горизонтали в зависимости от стороны сегмента) по формуле как среднее приращение ширины темного элемента (штриха) при печати для пар элементов (темный/светлый или штрих/пробел, в которой "штрих" - это ширина темного элемента, а "пробел" - ширина светлого элемента в оставшейся паре элементов):

 

;
;
 

_______________

Обозначения в формуле:
 
- среднее приращение ширины темного элемента (штриха) при печати;
 
- обозначение среднеарифметического значения;
 
- ширина темного элемента (штриха);
 
- ширина светлого элемента (пробела).
 

2) вычисляют центр темного элемента (штриха) в паре элементов, занимающих среднее положение, используя следующее смещение в сторону темного элемента (штриха) от внешнего края темного элемента (штриха) в паре элементов, занимающих среднее положение:

 

,
,
 

_______________

Обозначения в формуле:
 
- смещение;
 
- среднее арифметическое значение измеренных расстояний от края до края;
 
- среднее приращение ширины темного элемента (штриха) при печати.
 

Если есть более одной пары элементов, занимающих среднее положение, выбирают единственную пару, используя следующий процесс:

 

i) просматривают список краев (пар элементов) в порядке увеличения расстояния от границы L-образного шаблона поиска. Количество краев должно быть нечетным числом, поскольку они начинаются и заканчиваются с перехода от темного к светлому, начиная с L-образного шаблона поиска;

 

ii) средний край в этом списке называют центральным краем;

 

iii) вычисляют (нечетное число) расстояния от края до края пар элементов и находят их медиану
;
 
iv) выбирают одну или более пар элементов с длиной
;
 

v) среди этих пар выбирают одну или две пары краев элементов, которые имеют края, самые близкие к центральному краю;

 

vi) если необходимо, выбирают пару элементов, которые имеют внешний темный край, самый близкий к центральному краю;

 

vii) если необходимо, выбирают пару элементов, которые имеют внутренний край, самый близкий к центральному краю;

 

3) начиная от центра темного элемента (штриха) пары элементов, занимающих среднее положение, из этапа, указанного в перечислении f) 3), и продолжая процесс в направлении светлого элемента (пробела) из пары элементов, до конца ограниченной средней линии, вычисляют центр каждого элемента, выделенного белыми точками на темном фоне (рисунок 13) с выполнением следующих действий:

 

Рисунок 13 - Измерения расстояний от края до края для определения центра каждого элемента

 

Примечание - На рисунке 13 показаны три темных (штриха) и два светлых элемента (пробела). Если элемент, центр которого вычисляют, светлый (пробел), то на схеме должны быть представлены три светлых элемента (пробела) вместо темных (штрихов) и два темных элемента (штриха) вместо светлых (пробелов). Для светлых элементов (пробелов), смежных с конечными элементами средней линии, измерения расстояний
или
не проводят, поскольку они оказываются за границами символа или измеряемого сегмента.
 
i) вычисляют точку p1, находящуюся на средней линии на расстоянии
от предыдущего вычисленного центра элемента в направлении нового элемента;
 
ii) вычисляют значения
:
 
,
 
,
 
,
 
.
 
iii) если одно из значений
находится в пределах 25% от
, выбирают одно из значений
, ближайшее к
, и устанавливают новое значение
как среднее между текущим значением
и выбранным
из диапазона
:
 
I) если выбрано значение
или
, определяют соответствующий край
или
, ближайший к элементу, центр которого необходимо вычислить. Сдвигают этот край на расстояние
в соответствующем направлении (то есть, если приращение ширины темного элемента (штриха)
положительная величина, смещение края должно быть в сторону светлого элемента (пробела), заключенного в пределах значений
или
, и, если отрицательная, смещение должно быть в противоположную сторону от светлого элемента). Вычисляют точку р2, находящуюся на средней линии на расстоянии 0,75 выбранного значения
или
от этого смещенного края в сторону элемента, центр которого должен быть вычислен;
 
II) если выбрано значение
или
, определяют соответствующий край
или
, ближайший к элементу, центр которого необходимо вычислить. Сдвигают этот край на расстояние
в соответствующем направлении (то есть, если приращение ширины темного элемента (штриха) при печати является положительным значением, смещение края должно быть проведено в сторону светлого элемента (пробела), заключенного в пределах значений
или
, и, если отрицательным, смещение должно быть в противоположную сторону от светлого элемента). Вычисляют точку р2, находящуюся на средней линии на расстоянии 0,25 выбранного значения
или
от смещенного края в сторону элемента, центр которого следует вычислить;
 

III) считают, что центр элемента находится точно посередине между точками p1 и р2;

 

iv) в противном случае, если ни одно из значений
,
,
,
не находится в пределах 25%
, оставляют текущее значение
, используют p1 как центр нового элемента и переходят к определению следующего элемента;
 

4) начиная с темного элемента в паре элементов, занимающих среднее положение, и продолжая в противоположном направлении по отношению к определенному на этапе, указанном в пункте 3), вплоть до окончания ограниченной средней линии, вычисляют центры каждого элемента, используя порядок действий, установленный для этапа, указанного в перечислении 3);

 

h) если число модулей в каждой стороне не соответствует допустимой первой области, продолжают искать с этапа, указанного в перечислении d) 6), для следующего левого пика и впадины. Иначе составляют пробную сетку модулей данных в области данных, проводя линии из центров модулей шаблона чередующихся модулей:

 

1) для каждой стороны продолжают каждую линию, построенную на этапе, указанном в перечислении е) 3), и линию противоположной стороны L-образной структуры для формирования точек схода двух почти параллельных линий;

 

2) из каждой точки схода проводят лучи, проходящие через центры модулей, построенные на этапе, указанном в перечислении g), в направлении, близком к перпендикуляру к линии, полученной на этапе, указанном в перечислении е) 3);

 

3) точки пересечения этих двух направлений лучей, близких к перпендикулярным, должны соответствовать центрам модулей данных в области данных (рисунок 14);

 

Рисунок 14 - Формирование реальной сетки модулей

 

i) продолжают заполнение остальных областей данных;

 

1) в процессе составления области данных формируют новую L-образную структуру части данных левее или выше, используя одну из двух следующих процедур:

 

i) если новая область данных по-прежнему ограничена с одной стороны исходной L-образной структурой, полученной на этапе, указанном в перечислении b), повторяют этап, указанный в перечислении с), устанавливая новую область данных и используя множество точек, выбранных на этапе, указанном в перечислении е) 2), и множество точек на стороне L-образной структуры из этапа, указанного в перечислении b) 2), которые находятся за пределами линии, полученной на этапе, указанном в перечислении е) 2).

 

ii) если новая область данных ограничена с двух сторон другими областями данных, повторяют порядок действий с этапа, указанного в перечислении с), для определения новой области данных с помощью множества точек, выбранных на этапе, указанном в перечислении е) 2), для каждой области данных, которая примыкает и ограничивает новую область данных с двух сторон;

 

2) если область данных не соответствует по числу модулей ранее полученным областям данных, символ корректируют путем его уменьшения до ближайшего большего числа областей, допускаемых стандартом для символа;

 

3) декодируют символ с одной или несколькими областями данных, начиная с последовательности действий, установленных на этапе, указанном в перечислении k);

 

4) если в текущей области данных закончили просмотр последнего пика и впадины, возвращаются в предыдущую область данных и продолжают поиск с этапа, указанного в перечислении d) 6) для следующего оставшегося пика и впадины в этой области данных;

 

j) находят области данных прямоугольного символа:

 

1) для каждой стороны L-образной структуры передвигают линию поиска, перпендикулярную этой стороне, от вершины угла L-образной структуры, осуществляя сканирование по длине другой стороны L-образной структуры, сохраняя линию поиска параллельной другой стороне L-образной структуры. Каждый раз, когда линия поиска сдвигается на один пиксель изображения, подсчитывают число переходов от черного к белому и от белого к черному, начиная и заканчивая подсчет с перехода от цвета стороны L-образной структуры к противоположному цвету. Подсчет переходов следует делать только тогда, когда линия поиска имеет те же самые цвета, что и две линии непосредственно выше и ниже (левее и правее) текущей, и отличается по цвету от предыдущей линии поиска, для которой такой подсчет делался. Строят график зависимости числа переходов
от расстояния
, на которое сдвигают линию поиска. Продолжают, пока линия не сдвинется на длину противоположной стороны L-образной структуры +10%;
 
2) для каждого направления рассматривают графики
, начиная с наименьших значений по оси
, с постепенным увеличением значений
по этой оси. Находят первое место, где значение
(
- максимальное значение одной из двух величин - ноль и
) станет меньше, чем 15% предшествующего местного максимума значения
, при условии, что значение
больше единицы. Увеличивают значение
, пока значение
не перестанет уменьшаться. Если в следующей точке значение
не увеличивается, увеличивают значение
еще раз. Отмечают это значение
как соответствующее впадине. Увеличивают значение
для поиска локального максимума до тех пор, пока
не начнет уменьшаться, и отмечают это значение
как соответствующее пику. Точку
посередине между
пика и
впадины отмечают как
линии убывания. Линия впадины в этой точке может формировать сторону символа или его области данных;
 

3) ищут чередующийся шаблон поиска для каждой области данных, как описано на этапе, указанном в перечислении е);

 

4) составляют примерную сетку модулей области данных символа, как описано на этапах, указанных в перечислениях i), g) и h);

 

5) если область данных не является надлежащим прямоугольным символом, формируют новый регион данных, используя следующие пики и впадины;

 

6) строят все добавочные области данных, как описано на этапе, указанном в перечислении i);

7) если удалось обнаружить правильную область данных или две области, пытаются декодировать символ, как описано на этапах, указанных в перечислениях k) и l). Если область(и) не удается декодировать, исключают эту(и) область-кандидат;

 

k) если число модулей данных является четным числом или символ имеет надлежащую прямоугольную форму, выполняют его декодирование, используя алгоритм исправления ошибок Рида-Соломона:

 

1) определяют модули данных в предполагаемых центрах сетки. Темный модуль соответствует единице, светлый модуль - нулю;

 

2) преобразуют группы по восемь модулей по определенным шаблонам кодовых слов в 8-битовые значения знаков символа;

 

3) выполняют процедуру исправления ошибок Рида-Соломона с полученными значениями знаков символа;

 

4) декодируют знаки символа в знаки данных в соответствии с установленными схемами декодирования;

 

l) если число модулей данных является нечетным числом, то декодируют символ, используя алгоритм сверточного кода исправления ошибок:

 

1) определяют модули данных в предполагаемых центрах сетки. Темный модуль соответствует единице, светлый модуль - нулю;

 

2) применяют черно-белую выравнивающую маску;

 

3) используя соответствующую таблицу расположения битов, преобразуют данные в двоичный поток;

 

4) затем применяют алгоритм сверточного кода исправления ошибок;

 

5) преобразуют битовый поток в знаки данных, используя соответствующую схему кодирования;

 

6) выполняют проверку правильности контрольной суммы CRC.   

 

Раздел 9. (Измененная редакция, Изм. N 1).  

          

 

      

 

      10 Рекомендации для пользователя

   10.1 Интерпретация для визуального чтения  

Поскольку символы Data Matrix могут содержать тысячи знаков, интерпретация для визуального чтения знаков данных в виде расположенного рядом обычного текста может оказаться неудобной. Как альтернатива, символ может сопровождать краткий описательный текст, а не весь закодированный. Размер знаков и тип шрифта не устанавливаются, и такое сообщение может быть напечатано в любом месте вблизи символа Data Matrix. Текст интерпретации для визуального чтения не должен накладываться ни на символ Data Matrix , ни на свободные зоны вокруг него.

 

10.2 Способность к автоматическому распознаванию

 

Символика Data Matrix может наряду с некоторыми другими символиками использоваться в среде автоматического распознавания (приложение S).

 

10.3 Системные подходы

 

Прикладные системы применения Data Matrix должны рассматриваться в качестве целостных системных решений (приложение Т).

 

 

      11 Передаваемые данные

Данный раздел описывает типовой протокол передачи данных для совместимых устройств считывания. Такие устройства считывания могут быть запрограммированы на поддержку иных вариантов передачи. Все закодированные знаки данных должны быть включены в передаваемые данные. Управляющие знаки символики и знаки исправления ошибок не передаются. Более сложные вопросы интерпретации данных рассмотрены далее в настоящем разделе.

        

11.1 Протокол для знака FNC1 (только для символики версии ЕСС 200)

 

Когда знак FNC1 находится в позиции первого знака символа (или в позиции пятого знака символа в первом символе последовательности структурированного соединения), это является признаком соответствия данных типовому формату идентификаторов применения (Al) GS1. Знак FNC1 в любой более дальней позиции такого символа выполняет функцию разделителя полей. Данный протокол должен обеспечивать передачу идентификатора символики. Первый знак FNC1 не должен быть представлен в передаваемых данных, хотя на его присутствие указывает использование в идентификаторе символики знака модификации со значением 2 (11.5).

 

Когда знак FNC1 используют как разделитель полей, он должен быть представлен в передаваемом сообщении как управляющий знак <
> КОИ-7 (ASCII) с десятичным значением 29.
 

11.2 Протокол для знака FNC1 во второй позиции (только для символики версии ЕСС 200)

 

Когда знак FNC1 находится в позиции второго знака символа (или в позиции шестого знака символа в первом символе последовательности структурированного соединения), это является признаком того, что данные соответствуют определенному международному отраслевому стандартному формату. Указанный протокол должен обеспечивать передачу идентификатора символики. Первый знак FNC1 не должен быть представлен в передаваемых данных, хотя на его присутствие указывает использование соответствующего знака-модификатора со значением 3 в идентификаторе символики (11.5). Данные, закодированные в первом знаке символа, должны передаваться как обычно в начале данных. Когда знак FNC1 используется как разделитель полей, он должен быть представлен в передаваемом сообщении как управляющий знак <
> ASCII (КОИ-7) с десятичным значением 29.
 

         

11.3 Протокол для знаков Macro в первой позиции (только для символики версии ЕСС 200)

 

Данный протокол используют для кодирования с уплотнением двух специальных головных и конечных меток сообщения в символах Data Matrix версии ЕСС 200.

 

Когда знак Macro находится в первой позиции, должны передаваться вводная и заключительная части сообщений. Если первый знак символа содержит кодовое слово со значением 236 (т.е. закодированный знак Macro 05), то кодируемым данным должна предшествовать вводная часть
, за которой следуют данные. Если первый знак символа содержит кодовое слово со значением 237 (т.е. закодированный знак Macro 06), то кодируемым данным должна предшествовать вводная часть
, за которой следуют данные. В обоих случаях после данных должна быть передана заключительная часть
.
 

        

11.4 Протокол для интерпретаций в расширенном канале ECI (только для символики версии ЕСС 200)

 

В системах, которые поддерживают интерпретации в расширенном канале (ECI), необходимо использовать префиксы идентификаторов символики при каждой передаче данных. Если присутствует кодовое слово ECI, его следует передавать как управляющий знак с десятичным значением 92
(или с шестнадцатеричным значением 5
), представляемый знаком "\" (ОБРАТНАЯ ДРОБНАЯ ЧЕРТА) в интерпретации, принимаемой по умолчанию. Следующие кодовые слова преобразуют в 6-разрядные значения в соответствии с правилами преобразования, обратными приведенным в таблице 6*. Полученные 6-разрядные значения передают как знаки с соответствующими десятичными значениями ASCII (КОИ-7) (от 48 до 57). Прикладное программное обеспечение после распознавания последовательности \nnnnnn должно интерпретировать все последующие знаки как знаки интерпретации ECI, установленной в соответствии с указанным 6-разрядным значением. Эта интерпретация действует до окончания кодируемых данных или до появления другой последовательности ECI.
 

________________

* Обратное преобразование - это перевод последовательности кодовых слов в номер назначения ECI.

 

Если знак ОБРАТНАЯ ДРОБНАЯ ЧЕРТА (байт с десятичным значением 92
) должен быть использован в кодируемых данных, то его передача должна осуществляться следующим образом. В случае, когда знак ASCII (КОИ-7 со значением 92
) встречается как знак данных, должны быть переданы два байта с этим же значением, таким образом в случае одиночного применения знак действует как управляющий знак, а появление сдвоенных знаков свидетельствует о появлении знака данных.
 

Примеры:

 

Закодированные данные А\\В\С.

 

Передаваемые данные A\\\\B\\C.

 

Использование идентификатора символики обеспечивает правильность интерпретации управляющего знака в данном прикладном применении.

          

11.5 Идентификатор символики

 

ИСО/МЭК 15424 предусматривает типовую процедуру указания символики, которая была считана, наряду с набором вариантов, установленных в декодере, и специальными свойствами, которые могут быть включены в символ.

 

После того как структура данных (включая использование любых ECI), идентифицирована, декодер должен добавить соответствующий идентификатор символики в виде префикса к передаваемым данным. Идентификатор символики также необходим в случае, если одна или несколько интерпретаций в расширенном канале (ECI) появляются в символе или при использовании знака FNC1 в соответствии с 11.1 и 11.2. Идентификаторы символики и значения возможных вариантов, которые возможны для применения в символике Data Matrix, приведены в приложении N.

          

11.6 Пример передаваемых данных

 

В данном примере сообщение, состоящее из двух знаков "¶Ж" должно быть закодировано в символе версии ЕСС 200 с помощью схемы кодирования ASCII (КОИ-7/КОИ-8). Знак "¶" представляют байтом с десятичным значением 182 в наборе знаков по умолчанию Data Matrix (номер назначения ECI 000003 соответствует набору знаков по ИСО 8859-1). Буква кириллицы "Ж" отсутствует в ECI 000003, но представлена в ИСО 8859-5* (номер назначения ECI 000007) байтом с тем же десятичным значением 182. Полное сообщение, следовательно, может быть представлено, путем вставки переключения к ECI 000007 после первого знака следующим образом.

________________

* Набор 8-битовых знаков (версия КОИ-8) по ИСО/МЭК 8859-5 приведен в приложении V.

 

Символ кодирует сообщение

 

<¶> <переключение к ECI 000007> <Ж>,

используя следующую последовательность кодовых слов Data Matrix:

 

[знак верхнего регистра] [55] [ECI] [8] [знак верхнего регистра] [55]

 

с десятичными значениями [235], [55], [241], [8], [235], [55].

 

Примечание 1 - Знак верхнего регистра с последующим кодовым словом, имеющим значение 55, кодирует байт с десятичным значением 182.

 

Примечание 2 - Номер назначения ECI в символе Data Matrix кодируют как ECI+1.

 

Декодер передает байты со следующими значениями (включая префикс идентификатора символики, вариант символики, знак-модификатор 4, указывающий на использование протокола ECI):

 

93, 100, 52, 182, 92, 48, 48, 48, 48, 48, 55, 182.

В графических знаках эта запись будет выглядеть следующим образом в интерпретации по умолчанию:

 

]d4¶\000007¶

Декодер отвечает за передачу сигнала переключения к ECI 000007, но не за интерпретацию результата. Программное обеспечение с поддержкой ECI в приемной прикладной системе удалит управляющую последовательность ECI 000007, и буква "Ж" будет представлена способом, принятым в системе (т.е. путем изменения шрифта в файле распечатки). Конечным результатом будет соответствие исходному сообщению с буквой "Ж".

 

   

 

Приложение А

(обязательное)

 

      

Процесс чередования в символике версии ЕСС 200

А.1 Пояснительная схема

 

Рассмотрим пример символа размером 72х72 модулей, для которого необходимо четыре уровня чередования, чтобы закодировать 368 кодовых слов данных и 144 кодовых слова исправления ошибок. Кодовые слова делят на четыре блока по 92 кодовых слова данных и 36 кодовых слов исправления ошибок с общей длиной каждого блока - 128 кодовых слов.

 

 

Рисунок А.1 - Схема процесса чередования для символа размером 72х72

А.2 Начальная последовательность для чередования в символах различных размеров

 

Последовательность чередующихся кодовых слов данных и кодовых слов исправления ошибок приведена в таблице А.1.

 

 

Таблица А.1 - Последовательность кодовых слов данных и исправления ошибок для символов разных размеров

 

 

 

 

 

 

 

 

Размер символа

Блок Рида-Соломона

Последовательность кодовых слов данных

Последовательность кодовых слов исправления ошибок

52х52

1

1, 3, 5

201, 203

1, 3, 5

81, 83

 

2

2, 4, 6

202, 204

2, 4, 6

82, 84

64х64

1

1, 3, 5

277, 279

1, 3, 5

109, 111

 

2

2, 4, 6

278, 280

2, 4, 6

110, 112

72х72

1

1, 5, 9

361, 365

1, 5, 9

137, 141

 

2

2, 6, 10

362, 366

2, 6, 10

138, 142

 

3

3, 7, 11

363, 367

3, 7, 11

139, 143

 

4

4, 8, 12

364, 368

4, 8, 12

140, 144

80х80

1

1, 5, 9

449, 453

1, 5, 9

185, 189

 

2

2, 6, 10

450, 454

2, 6, 10

186, 190

 

3

3, 7, 11

451, 455

3, 7, 11

187, 191

 

4

4, 8, 12

452, 456

4, 8, 12

188, 192

88х88

1

1, 5, 9

569, 573

1, 5, 9

217, 221

 

2

2, 6, 10

570, 574

2, 6, 10

218, 222

 

3

3, 7, 11

571, 575

3, 7, 11

219, 223

 

4

4, 8, 12

572, 576

4, 8, 12

220, 224

96х96

1

1, 5, 9

689, 693

1, 5, 9

265, 269

 

2

2, 6, 10

690, 694

2, 6, 10

266, 270

 

3

3, 7, 11

691, 695

3, 7, 11

267, 271

 

4

4, 8, 12

692, 696

4, 8, 12

268, 272

104х104

1

1, 7, 13

805, 811

1, 7, 13

325, 331

 

2

2, 8, 14

806, 812

2, 8, 14

326, 332

 

3

3, 9, 15

807, 813

3, 9, 15

327, 333

 

4

4, 10, 16

808, 814

4, 10, 16

328, 334

 

5

5, 11, 17

809, 815

5, 11, 17

329, 335

 

6

6, 12, 18

810, 816

6, 12, 18

330, 336

120х120

1

1, 7, 13

1039, 1045

1, 7, 13

397, 403

 

2

2, 8, 14

1040, 1046

2, 8, 14

398, 404

 

3

3, 9, 15

1041, 1047

3, 9, 15

399, 405

 

4

4, 10, 16

1042, 1048

4, 10, 16

400, 406

 

5

5, 11, 17

1043, 1049

5, 11, 17

401, 407

 

6

6, 12, 18

1044, 1050

6, 12, 18

402, 408

132х132

1

1, 9, 17

1289, 1297

1, 9, 17

481, 489

 

2

2, 10, 18

1290, 1298

2, 10, 18

482, 490

 

3

3, 11, 19

1291, 1299

3, 11, 19

483, 491

 

4

4, 12, 20

1292, 1300

4, 12, 20

484, 492

 

5

5, 13, 21

1293, 1301

5, 13, 21

485, 493

 

6

6, 14, 22

1294, 1302

6, 14, 22

486, 494

 

7

7, 15, 23

1295, 1303

7, 15, 23

487, 495

 

8

8, 16, 24

1296, 1304

8, 16, 24

488, 496

144х144

1

1, 11, 21

1541, 1551

1, 11, 21

601, 611

 

2

2, 12, 22

1542, 1552

2, 12, 22

602, 612

 

3

3, 13, 23

1543, 1553

3, 13, 23

603, 613

 

4

4, 14, 24

1544, 1554

4, 14, 24

604, 614

 

5

5, 15, 25

1545, 1555

5, 15, 25

605, 615

 

6

6, 16, 26

1546, 1556

6, 16, 26

606, 616

 

7

7, 17, 27

1547, 1557

7, 17, 27

607, 617