ГОСТ Р ИСО/МЭК 16022-2008
Группа П85
НАЦИОНАЛЬНЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ
Автоматическая идентификация
КОДИРОВАНИЕ ШТРИХОВОЕ
Спецификация символики Data Matrix
Automatic identification. Bar coding. Data Matrix symbology specification
ОКС 35.040
Дата введения 2010-01-01
Предисловие
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. N 184-ФЗ "О техническом регулировании", а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 "Стандартизация в Российской Федерации. Основные положения"*
Сведения о стандарте
1 ПОДГОТОВЛЕН Ассоциацией автоматической идентификации "ЮНИСКАН/ГС1 РУС" совместно с Обществом с ограниченной ответственностью (ООО) НПЦ "Интелком" на основе аутентичного перевода стандарта, указанного в пункте 4, выполненного ООО НПЦ "Интелком"
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 355 "Автоматическая идентификация"
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 18 декабря 2008 г. N 509-ст
4 Настоящий стандарт идентичен международному стандарту ИСО/МЭК 16022:2006* "Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация символики штрихового кода Data Matrix" (ISO/IEC 16022:2006 "Information technology - Automatic identification and data capture techniques - Data Matrix bar code symbology specification"), за исключением приложения U, содержащего сведения о соответствии терминов на русском и английском языках, приложения V, включающего в себя сведения о наборах знаков по ИСО/МЭК 646, ИСО/МЭК 8859-1 и ИСО/МЭК 8859-5. В приложении М приведены исправления в соответствии со списком технических опечаток 1 (Technical Corrigendum 1) к ISO/IEC 16022.1:2006.
Наименование национального стандарта изменено относительно наименования указанного международного стандарта для приведения в соответствие с ГОСТ Р 1.5-2004* (подраздел 3.5) и учета его принадлежности к группе стандартов "Автоматическая идентификация".
При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных (региональных) стандартов соответствующие им национальные стандарты, сведения о которых приведены в дополнительном приложении W
5 ВВЕДЕН ВПЕРВЫЕ
ВНЕСЕНО Изменение N 1, утвержденное и введенное в действие Приказом Росстандарта от 26.09.2013 N 1112-ст c 01.01.2014
Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе "Национальные стандарты", а текст изменений и поправок - в ежемесячно издаваемых информационных указателях "Национальные стандарты". В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе "Национальные стандарты". Соответствующая информация, уведомления и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет
Введение
Data Matrix - двухмерная матричная символика, состоящая из квадратных модулей, упорядоченных внутри периметра шаблона поиска. В настоящем документе представление символа и его описание приведено, главным образом, для темных модулей на светлом фоне. Тем не менее, символы Data Matrix также могут быть напечатаны в виде светлых модулей на темном фоне.
Производителям оборудования и пользователям технологии штрихового кодирования необходима общедоступная стандартная спецификация символики, на которую они могли бы ссылаться при разработке оборудования и стандартов по применению. С этой целью и был разработан настоящий стандарт.
Следует обратить внимание на возможность того, что некоторые элементы, включенные в настоящий стандарт, могут быть объектом патентного права, и организации ИСО и МЭК не берут на себя ответственность за определение некоторых или всех подобных патентных прав.
Сноски в тексте стандарта, выделенные курсивом, приведены для пояснения текста стандарта.
1 Область применения
Настоящий стандарт устанавливает требования к символике Data Matrix*, а также параметры символики, кодирование знаков данных, форматы символов, требования к размерам и качеству печати, правила исправления ошибок, алгоритм декодирования и прикладные параметры, выбираемые пользователем.
________________
* Название символики произносится как Дата Матрикс, что в переводе на русский язык - "матрица данных".
Настоящий стандарт распространяется на все символы символики Data Matrix, напечатанные или нанесенные каким-либо другим способом.
2 Нормативные ссылки
В настоящем стандарте использованы нормативные ссылки на следующие стандарты и другие нормативные документы*, которые необходимо учитывать при использовании настоящего стандарта. В случае ссылок на документы, у которых указана дата утверждения, необходимо пользоваться только указанной редакцией. В случае, когда дата утверждения не приведена, следует пользоваться последней редакцией ссылочных документов, включая любые поправки и изменения к ним:
ИСО/МЭК 15424 Информационные технологии. Технологии автоматической идентификации и сбора данных. Идентификаторы носителей данных (включая идентификаторы символик) (Information technology - Automatic identification and data capture techniques - Data Carrier Identifiers (including Symbology Identifiers)
ИСО/МЭК 19762-1 Информационные технологии. Технологии автоматической идентификации и сбора данных. Гармонизированный словарь. Часть 1. Общие термины, связанные с автоматической идентификацией и сбором данных (Information technology - Automatic identification and data capture (AIDC) techniques - Harmonized vocabulary - Part 1: General terms relating to AIDC)
ИСО/МЭК 19762-2 Информационные технологии. Технологии автоматической идентификации и сбора данных. Гармонизированный словарь. Часть 2. Средства для оптического считывания (Information technology - Automatic identification and data capture (AIDC) techniques - Harmonized vocabulary - Part 2: Optically readable media (ORM))
ИСО/МЭК 15415 Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация испытаний качества печати символов штрихового кода. Двумерные символы (Information technology - Automatic identification and data capture techniques - Bar code print quality test specification - Two-dimensional symbols)
ИСО/МЭК 15416 Информационные технологии. Технологии автоматической идентификации и сбора данных. Спецификация испытаний качества печати символов штрихового кода. Линейные символы (Information technology - Automatic identification and data capture techniques - Bar code print quality test specification - Linear symbols)
ИСО/МЭК 646:1991 Информационные технологии. Набор 7-битовых кодированных знаков ИСО для обмена информацией (Information technology - ISO 7-bit coded character set for information interchange)
ИСО/МЭК 8859-1 Информационные технологии. Наборы 8-битовых однобайтных кодированных графических знаков. Часть 1. Латинский алфавит N 1 (Information technology - 8-bit single-byte coded graphic character sets - Part 1: Latin alphabet N 1)
ИСО/МЭК 8859-5:1999 Информационные технологии. Наборы 8-битовых однобайтных кодированных графических знаков. Часть 5. Латинский/кирилловский алфавит (Information technology - 8-bit single-byte coded graphic character sets - Part 5: Latin/Cyrillic alphabet)
AIM Inc. ITS/04-001 Международный технический стандарт. Интерпретации в расширенном канале. Часть 1. Схемы идентификации и протокол (AIM Inc. ITS/04-001 International Technical Standard: Extended Channel Interpretations - Part 1: Identification Schemes and Protocol)
3 Термины, определения, символы и математические/логические обозначения
3.1 Термины и определения
В данном документе используются термины, определенные в ИСО/МЭК 19762-1, ИСО/МЭК 19762-2, а также следующие:
3.1.1 кодовое слово (codeword): Значение знака символа, формируемое на промежуточном уровне кодирования в процессе преобразования исходных данных в их графическое представление в символе.
3.1.2 модуль (module): Отдельная ячейка матричной символики, используемая для кодирования одного бита информации и имеющая номинально квадратную форму в символах Data Matrix.
3.1.3 сверточное кодирование (convolutional coding): Алгоритм контроля и исправления ошибок, преобразующий множество битов на входе во множество битов на выходе, которое может быть восстановлено после повреждения, путем кодирования с разделением множества входящих битов на блоки с последующим проведением операции свертки каждого входящего блока с регистром сдвига со множеством состояний для получения защищенных на выходе блоков.
Примечание - Такие алгоритмы кодирования могут быть реализованы с помощью аппаратных средств путем использования входных и выходных коммутаторов, регистров сдвига и вентилей исключающих ИЛИ*.
________________
* Международное обозначение операции исключающее ИЛИ: exclusive-or - XOR.
3.1.4 шаблонная рандомизация (pattern randomising): Процедура, с помощью которой исходный набор битов превращают в другой набор битов путем инвертирования отдельных битов с целью уменьшения вероятности повторения в символе одинаковых наборов.
3.2 Символы
В данном документе, если иное не предусмотрено в особых случаях, применяют следующие математические символы:
|
|
- число кодовых слов исправления ошибок; | |
- число стираний; | |
- (для версии ЕСС 000-140) число битов в полном сегменте на входе в конечный автомат для генерирования сверточного кода;
(для версии ЕСС 200) общее число кодовых слов исправления ошибок; | |
- порядок памяти сверточного кода; | |
- (для версии ЕСС 000-140) число битов в полном сегменте, сгенерированных конечным автоматом, порождающим сверточный код; (для версии ЕСС 200) общее число кодовых слов данных; | |
- числовое основание в схеме кодирования; | |
- число кодовых слов, зарезервированных для обнаружения ошибок; | |
- знак символа; | |
- число ошибок; | |
- сегмент битов на входе в конечный автомат, принимающий битов за единицу времени; | |
- сегмент битов на выходе из конечного автомата, генерирующего битов за единицу времени; | |
- горизонтальный и вертикальный размеры модуля; | |
- кодовое слово исправления ошибок. |
3.3 Математические обозначения
В настоящем стандарте используются следующие обозначения и математические операции:
|
|
div | - оператор деления на целое число; |
mod | - остаток при делении на целое число; |
XOR | - исключающее ИЛИ (exclusive-or) - логическая функция или операция, результатом которой является единица только в случае неэквивалентности двух входов; |
LSB | - младший значащий разряд (Least Significant Bit); |
MSB | - старший значащий разряд (Most Significant Bit). |
4 Описание символов
4.1 Основные параметры
Data Matrix представляет собой двумерную матричную символику.
Существуют две версии символики Data Matrix:
- версия, обозначаемая ЕСС 200, в которой используют алгоритм исправления ошибок Рида-Соломона. Версия ЕСС 200 рекомендуется для разработки любого нового применения;
- версия, обозначаемая ЕСС 000-140, с несколькими доступными уровнями сверточного исправления ошибок, такими как ЕСС 000, ЕСС 050, ЕСС 080, ЕСС 100 и ЕСС 140. Версию ЕСС 000-140 следует использовать только для замкнутых прикладных систем, в которых одна и та же сторона контролирует создание и считывание символов и обеспечивает функционирование всей системы.
Символика Data Matrix имеет следующие параметры:
a) кодируемый набор знаков:
1) знаки набора ASCII (версии КОИ-7) по ИСО/МЭК 646* (согласно национальной версии США**) (далее - знаки ASCII (КОИ-7)) с десятичными значениями от 0 до 127.
________________
* Набор знаков ASCII (версия КОИ-7) по ИСО/МЭК 646 приведен в приложении V.
** Набор знаков по ANSI INCITS 4-1986 (R2007) Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII) (Информационные системы - Кодированные наборы знаков - 7-битовый американский национальный стандартный код для обмена информацией (7-битовый ASCII).
Примечание 1 - Указанная версия ASCII (КОИ-7) состоит из набора знаков G0 по ИСО/МЭК 646 и С0 по ИСО/МЭК 6429, в котором знаки с десятичными значениями от 28 до 31 соответствуют знакам FS, GS, RS и US соответственно;
2) знаки расширенного набора ASCII (версия КОИ-8) по ИСО/МЭК 8859-1* (далее - знаки расширенного набора ASCII (КОИ-8)) с десятичными значениями от 128 до 255;
b) представление данных: темный модуль соответствует двоичной единице, светлый - двоичному нулю.
________________
* Набор знаков расширенного набора ASCII (КОИ-8) приведен в приложении V.
Примечание 2 - Настоящий стандарт определяет символы Data Matrix как темные модули, расположенные на светлом фоне. Однако в 4.2 предусмотрено, что символы могут также быть образованы с заменой цвета на противоположный, и для таких символов положения настоящего стандарта в отношении темных модулей должны применяться к светлым модулям и наоборот;
c) размеры символа в модулях (без учета свободной зоны):
- для версии ЕСС 200 - от 10х10 до 144х144, только четные значения;
- для версии ЕСС 000-140 - от 9х9 до 49 на 49, только нечетные значения;
d) число знаков данных в символе (для символа максимального размера версии ЕСС 200):
1) алфавитно-цифровые данные - до 2335 знаков,
2) в 8-битовых байтах - 1555 знаков,
3) числовые данные - 3116 числовых разрядов;
e) задаваемое исправление ошибок:
- для версии ЕСС 200 - исправление ошибок Рида-Соломона;
- для версии ЕСС 000-140 - четыре уровня исправления ошибок на основе сверточного кода плюс (по выбору) только обнаружение ошибки;
f) тип кода: матричный;
g) независимость от ориентации: присутствует.
4.2 Дополнительные свойства
Символика Data Matrix обладает следующими дополнительными, неотъемлемыми или устанавливаемыми по выбору свойствами:
a) обратимость изображения (неотъемлемое свойство). Символы предназначены для считывания как напечатанные темным на светлом фоне, так и светлым на темном фоне (рисунок 1). Положения настоящего стандарта установлены для темного изображения на светлом фоне, следовательно указания о темных или светлых модулях должны рассматриваться как указания о светлых или темных модулях соответственно для символов с обращением изображения;
b) интерпретации в расширенном канале (только для версии ЕСС 200, свойство по выбору). Данный механизм позволяет использовать знаки из иных наборов (например, знаки арабского, кирилловского, греческого, еврейского алфавитов) и иных различных интерпретаций данных или представлять их в соответствии с особыми отраслевыми требованиями;
c) прямоугольная форма символов (только для версии ЕСС 200, свойство по выбору). Установлены шесть форматов символа прямоугольной формы;
d) структурированное соединение (только для версии ЕСС 200, свойство по выбору). Позволяет представить один документ в виде нескольких (до 16) символов Data Matrix. Исходные данные могут быть восстановлены вне зависимости от порядка сканирования символов.
а) темное изображение на светлом фоне для версии ЕСС 200
b) светлое изображение на темном фоне для версии ЕСС 200
с) темное изображение на светлом фоне для уровня ЕСС 140
Рисунок 1 - Пример кодирования сообщения "A1B2C3D4E5F6G7H8I9J0K1L2" в символе версии ЕСС 200 (рисунки а) и b)) и уровня ЕСС 140 (рисунок с))
4.3 Структура символов
Каждый символ Data Matrix состоит из областей данных, составленных из номинально квадратных модулей, структурированных в регулярную матрицу. В больших символах версии ЕСС 200 области данных отделены направляющими шаблонами. Область данных окружена шаблоном поиска, вокруг которого со всех четырех сторон должна быть свободная зона. На рисунке 1 приведен пример символа уровня ЕСС 140 и два примера символа версии ЕСС 200.
4.3.1 Шаблон поиска
Шаблоном поиска является периметр области данных шириной в один модуль. Две смежные стороны - левая и нижняя, являются сплошными темными линиями и формируют L-образную границу. Они используются, прежде всего, для определения реального размера, ориентации и искажений символа. Две противоположные стороны состоят из чередующихся темных и светлых модулей. Они используются, прежде всего, для определения структуры символа, состоящей из ячеек, но также могут применяться для определения физического размера и искажений символа. Наличие свободной зоны обозначено на рисунке 1 угловыми метками.
4.3.2 Размеры и емкость символов
Символы версии ЕСС 200 состоят из четного числа строк и четного числа столбцов. Символы версии ЕСС 200 могут быть квадратной формы с размерами (в модулях) от 10х10 до 144х144 без учета свободных зон, либо прямоугольной формы размерами (в модулях) от 8х18 до 16х48 без учета свободных зон. Все символы версии ЕСС 200 можно распознать по светлому модулю в правом верхнем углу. Полный перечень атрибутов символа версии ЕСС 200 приведен в 5.5 (таблица 7).
Символы версии ЕСС 000-140 состоят из нечетного числа строк и нечетного числа столбцов. Символы версии ЕСС 000-140 имеют квадратную форму размерами от 9х9 до 49х49 модулей без учета свободных зон. Данные символы можно распознать по темному модулю в правом верхнем углу. Полный перечень атрибутов символов версии ЕСС 000-140 приведен в приложении G.
5 Требования к символам версии ЕСС 200
5.1 Основные положения процедуры кодирования
Настоящий раздел содержит общие сведения о процедуре кодирования. В следующих разделах приведено более детальное рассмотрение указанной процедуры. Пример кодирования для символа версии ЕСС 200 приведен в приложении О. Преобразование данных пользователя в символ версии ЕСС 200 происходит в следующей последовательности:
Этап 1. Кодирование данных
Анализируют поток данных для определения разнообразия типов различных знаков, подлежащих кодированию. Символы версии ЕСС 200 содержат различные схемы кодирования, которые позволяют найденные множества знаков преобразовать в кодовые слова более эффективно по сравнению со схемой кодирования, принятой по умолчанию. Вводят дополнительные кодовые слова для переключения между схемами кодирования и для выполнения других функций. Добавляют необходимое количество знаков-заполнителей для образования требуемого числа кодовых слов. Если пользователь не установил размер матрицы, то выбирают наименьший размер, в котором могут быть размещены данные. Полный перечень размеров матриц приведен в 5.5 (таблица 7).
Этап 2. Формирование кодовых слов проверки и исправления ошибок
Для символов, содержащих более 255 кодовых слов, поток кодовых слов подразделяют на чередующиеся блоки, чтобы дать возможность обработки алгоритмами исправления ошибок (приложение А). Для каждого блока формируют кодовые слова исправления ошибок. Результатом этого процесса является удлинение потока кодовых слов на число кодовых слов исправления ошибок. Кодовые слова исправления ошибок помещают после кодовых слов данных.
Этап 3. Размещение модулей в матрице
Модули кодовых слов размещают в матрице. В матрицу вставляют модули направляющих шаблонов (при их наличии). Вокруг матрицы добавляют модули шаблона поиска.
5.2 Кодирование данных
5.2.1 Общие положения
Данные можно кодировать с использованием любой комбинации из шести схем кодирования (таблица 1), при этом кодирование по схеме ASCII (КОИ-7/КОИ-8) является основной схемой. Остальные схемы кодирования вызываются из схемы кодирования ASCII (КОИ-7/КОИ-8) с последующим возвратом к этой же схеме. Следует учитывать эффективность уплотнения (число битов на знак данных), приведенную в таблице 1. Лучшей схемой для выбранного набора данных может оказаться не та, у которой на знак данных приходится наименьшее число битов. Если требуется наибольшая степень уплотнения, то надо принимать в расчет служебную информацию для переключения между схемами кодирования и наборами знаков внутри одной схемы кодирования (приложение Р). Следует также учитывать, что даже если число кодовых слов минимизировано, поток кодовых слов может нуждаться в расширении для полного заполнения символа. Дополнение осуществляют путем использования знаков-заполнителей.
Таблица 1 - Схемы кодирования для символов версии ЕСС 200
|
|
|
Наименование схемы кодирования | Знаки | Число битов на один знак данных |
ASCII | Сдвоенные разряды чисел | 4 |
(КОИ-7/ | Знаки ASCII (КОИ-7) с десятичными значениями от 0 до 127 | 8 |
КОИ-8) | Знаки расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255 | 16 |
С40 | Цифры и прописные латинские буквы | 5,33 |
| Специальные знаки и строчные латинские буквы | 10,66* |
Text | Цифры и строчные латинские буквы | 5,33 |
| Специальные знаки и прописные латинские буквы | 10,66** |
ANSI X12 | Набор знаков данных для электронного обмена данными по ANSI X12 EDI | 5,33 |
EDIFACT | Знаки ASCII (КОИ-7) с десятичными значениями от 32 до 94 | 6 |
По основанию 256 | Любые байты с десятичными значениями от 0 до 255 | 8 |
* Кодируют как два значения в схеме кодирования С40 с использованием знака регистра (Shift).
** Кодируют как два значения в схеме кодирования Text с использованием знака регистра (Shift). |
5.2.2 Интерпретация знаков по умолчанию
Интерпретация знаков по умолчанию для знаков с десятичными значениями от 0 до 127 должна соответствовать версии КОИ-7 по ИСО/МЭК 646, а для знаков с десятичными значениями от 128 до 255 - версии КОИ-8 по ИСО 8859-1 "Латинский алфавит N 1". Графические представления знаков данных, приведенных в настоящем стандарте, соответствуют интерпретации по умолчанию. Эта интерпретация может быть изменена с помощью переключающих последовательностей интерпретации в расширенном канале (5.4). Интерпретацией по умолчанию является ECI 000003.
5.2.3 Схема кодирования ASCII (КОИ-7/КОИ-8)
Схема кодирования ASCII (КОИ-7/КОИ-8) представляет собой набор знаков по умолчанию для первого знака символа в символах любого размера. С помощью указанной схемы кодируют знаки ASCII (КОИ-7) и расширенного набора ASCII (КОИ-8), числовые данные двойной плотности и управляющие знаки символики. Управляющие знаки символики включают в себя функциональные знаки, знак-заполнитель и знаки-переключатели на другие кодовые наборы. Знаки данных ASCII (КОИ-7) кодируют как кодовые слова с десятичными значениями от 1 до 128 (десятичное значение знака КОИ-7 плюс 1). Знаки данных расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255 кодируют с использованием управляющего знака верхнего регистра (Upper Shift) (5.2.4.2). Пары цифр от 00 до 99 кодируют кодовыми словами от 130 до 229 (числовое значение плюс 130). Присвоенные значения кодовых слов для схемы кодирования ASCII (КОИ-7/КОИ-8) приведены в таблице 2.
Таблица 2 - Значения кодовых слов в схеме кодирования ASCII (КОИ-7/КОИ-8)
|
|
Значение кодового слова | Знак данных или функция |
1-128 | Знаки данных ASCII (КОИ-7) (десятичное значение знака +1) |
129 | Знак-заполнитель |
130-229 | Пары цифр от 00 до 99 (числовое значение +130) |
230 | Знак фиксации схемы кодирования С40 |
231 | Знак фиксации схемы кодирования по основанию 256 |
232 | Знак FNC1 |
233 | Знак структурированного соединения |
234 | Знак программирования устройства считывания |
235 | Знак верхнего регистра (переход к расширенному набору ASCII (КОИ-8)) |
236 | Знак Макро 05 |
237 | Знак Макро 06 |
238 | Знак фиксации схемы кодирования Х12 |
239 | Знак фиксации схемы кодирования Text |
240 | Знак фиксации схемы кодирования EDIFACT |
241 | Знак интерпретации в расширенном канале (ECI) |
242-255 | Не подлежит использованию в схеме кодирования ASCII (КОИ-7/КОИ-8) |
5.2.4 Управляющие знаки символики
В символах версии ЕСС 200 есть несколько специальных управляющих знаков символики, имеющих особое значение для схемы кодирования. Эти знаки должны использоваться для сообщения команды декодеру на выполнение определенных функций или передачи управляющему компьютеру специальных данных (5.2.4.1-5.2.4.9). Эти управляющие знаки символики, за исключением знаков с десятичными значениями от 242 до 255, присутствуют в кодовом наборе ASCII (КОИ-7/КОИ-8) (таблица 2).
5.2.4.1 Знаки фиксации схемы кодирования (Latch)
Для переключения из схемы кодирования ASCII (КОИ-7/КОИ-8) в любую иную схему кодирования используют знаки фиксации. Все кодовые слова после знака фиксации должны кодироваться в соответствии с новой схемой кодирования. Различные схемы кодирования имеют свои способы возврата к кодовому набору ASCII (КОИ-7/КОИ-8).
5.2.4.2 Знак верхнего регистра (Upper Shift)
5.2.4.3 Знак-заполнитель (Pad)
Если кодируемых данных, независимо от используемой схемы кодирования, не хватает для полного заполнения символа для данных, то оставшаяся часть символа для данных должна быть заполнена знаками-заполнителями. Знаки-заполнители должны использоваться исключительно для указанной цели. Перед вводом знака-заполнителя необходимо вернуться к схеме кодирования ASCII (КОИ-7/КОИ-8) из любой другой используемой схемы кодирования.
Алгоритм рандомизации с шаблоном из 253 состояний применяют к знакам-заполнителям, ко всей последовательности знаков-заполнителей, начиная со второго знака-заполнителя и до конца символа (приложение В.1).
5.2.4.4 Знак интерпретации в расширенном канале (ECI)
Знак интерпретации в расширенном канале (ECI) используют для смены интерпретации, принятой по умолчанию, на иную интерпретацию, применяемую для кодирования данных. Протокол интерпретации в расширенном канале является общим для многих символик и его применение к символике версии ЕСС 200 более полно определено в 5.4. После знака ECI обязательно должны следовать одно, два или три кодовых слова, которые идентифицируют конкретную активизируемую ECI. Новая ECI действует до конца кодируемых данных или до тех пор, пока другой знак ECI не вызовет иную интерпретацию.
5.2.4.5 Знаки регистра (Shift) в схемах кодирования С40 и Text
В схемах кодирования С40 и Text используют три специальных знака, называемые знаками регистра, в качестве префикса к одному из 40 значений для кодирования примерно трех четвертей набора знаков ASCII (КОИ-7). Это позволяет добиться более компактного кодирования оставшихся знаков ASCII (КОИ-7) с помощью одиночных значений*.
________________
* Без предшествующего знака "Регистр" перед каждым знаком.
5.2.4.6 Знак FNC1 как идентификатор альтернативного типа данных
5.2.4.7 Знаки Макро (Macro)
Символика Data Matrix обеспечивает представление специальных международных отраслевых головной и конечной меток в одном знаке символа, которое сокращает число знаков символа, необходимых для кодирования данных в символе при использовании установленных структурированных форматов. Любой знак Макро применяют только в позиции первого знака символа. Эти знаки не должны использоваться вместе со структурированным соединением (Structured Append). Функции знаков Макро приведены в таблице 3. Головная метка должна быть включена в передаваемый поток данных в виде префикса, а конечная метка - суффикса*. Если используют идентификатор символики, то он должен предшествовать головной метке.
________________
* Суффикс является завершающим дополнением к потоку данных.
Таблица 3 - Функции знаков Макро
|
|
|
|
Значение кодового слова знака Макро | Обозначение знака | Интерпретация метки | |
|
| Головная метка | Конечная метка |
236 | Макро 05 | * | ** |
237 | Макро 06 | *** |
________________
* Знаки КОИ-7 (ASCII) с десятичными значениями 91, 41, 62, 30, 48, 53, 29.
** Знаки КОИ-7 (ASCII) с десятичными значениям 30, 4.
*** Знаки КОИ-7 (ASCII) с десятичными значениями 91, 41, 62, 30, 48, 54, 29.
5.2.4.8 Знак структурированного соединения (Structured Append)
Знак структурированного соединения используют для указания того, что символ является частью последовательности символов структурированного соединения в соответствии с 5.6.
5.2.4.9 Знак программирования устройства считывания
Знак программирования устройства считывания указывает на то, что в символе закодировано сообщение, предназначенное для программирования устройства считывания. Знак программирования устройства считывания должен быть первым кодовым словом символа и не подлежит использованию совместно со структурированным соединением.
5.2.5 Схема кодирования С40
Схему кодирования С40 применяют для оптимизации кодирования данных, состоящих из последовательности, включающей прописные буквы латинского алфавита и числа (включая знак ПРОБЕЛ). Данная схема позволяет также кодировать и другие знаки путем использования знаков регистра в комбинации с другими знаками данных.
Знаки данных в схеме кодирования С40 разделены на четыре набора. Знаки из первого набора, называемого основным набором, содержат три специальных знака регистра, знак ПРОБЕЛ и знаки ASCII (КОИ-7) c A по Z и с 0 по 9. Каждому знаку данных соответствует единственное значение схемы кодирования С40 (далее - значение С40). Знаки других наборов присваивают одному из трех знаков регистра, которые указывают на один из трех оставшихся наборов и сопровождаются одним из значений С40 (приложение С, таблица С.1).
В результате первого этапа кодирования каждый знак данных преобразуют в одно значение С40 или в пару значений С40. Затем полную строку значений С40 разбивают на группы по три значения (если в конце данных остается одно или два значения, то применяют специальные правила, приведенные в 5.2.5.2.). После этого три значения (С1, С2, С3) кодируют как одно 16-битовое значение по формуле (1600хС1)+(40хС2)+С3+1. В завершение каждое 16-битовое значение кодируют в двух кодовых словах, представляющих собой восемь старших битов и восемь младших битов.
5.2.5.1 Переключение на схему кодирования С40 и обратно
На схему кодирования С40 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования С40 со значением 230. Кодовое слово со значением 254, непосредственно следующее за парой кодовых слов в схеме кодирования С40, действует как отказ от фиксации (Unlatch) для возврата к схеме кодирования ASCII (КОИ-7/КОИ-8). В противном случае кодирование по схеме кодирования С40 сохраняется до окончания данных, закодированных в символе.
5.2.5.2 Правила кодирования С40
Каждая пара кодовых слов представляет собой 16-битовое значение, в котором первое кодовое слово соответствует восьми старшим битам, а второе - восьми младшим битам. Три значения С40 (С1, С2, С3) кодируют по формуле (1600хС1)+(40хС2)+С3+1.
В результате получают значения от 1 до 64000. Уплотнение трех значений С40 в два кодовых слова представлено на рисунке 2.
|
|
Исходные знаки данных | AIM |
Полученные значения С40 | 14, 22, 26 |
Вычисление 16-битового значения | (1600х14)+(40х22)+26+1=23307 |
Определение первого кодового слова: (16-битовое значение) div 256 | 23307 div 256=91 |
Определение второго кодового слова: (16-битовое значение) mod 256 | 23307 mod 256=11 |
Итоговые кодовые слова | 91, 11 |
Рисунок 2 - Пример кодирования по схеме кодирования С40
Для кодирования знаков, принадлежащих наборам Регистр 1 (Shift 1), Регистр 2 (Shift 2) и Регистр 3 (Shift 3), сначала следует закодировать соответствующий знак регистра, а затем - значение С40 для данных. Кодирование по схеме С40 может действовать до окончания кодовых слов символа, кодирующих данные.
В случае, если в символе остается только один или два знака символа до начала следования кодовых слов исправления ошибки, то следует придерживаться следующих правил:
a) если остаются два знака символа и кодированию подлежат три оставшихся значения С40 (которые могут включать как знаки данных, так и знаки регистра (Shift)), то эти три значения С40 кодируют в двух последних знаках символа. Заключительного кодового слова отказа от фиксации схемы кодирования (Unlatch) не требуется;
b) если остаются два знака символа и кодированию подлежат два оставшихся значения С40 (первое из которых может быть знаком регистра (Shift) или знаком данных, а второе должно представлять знак данных), то эти два оставшиеся значения С40 кодируют с добавлением значения заполнителя С40, равного 0 (из набора Регистр 1) в двух последних знаках символа. Кодового слова отказа от фиксации схемы кодирования (Unlatch) также не требуется;
c) если остаются два знака символа для кодирования одного оставшегося значения С40 (знака данных), то в первом из двух оставшихся знаков символа (предпоследнем знаке символа) кодируют отказ от фиксации схемы кодирования (Unlatch), а в последнем знаке символа кодируют знак данных по схеме кодирования ASCII (КОИ-7/КОИ-8);
d) если остается один знак символа для кодирования одного оставшегося значения С40 (знака данных), то в последнем знаке символа кодируют знак данных по схеме кодирования ASCII (КОИ-7/КОИ-8). Знак отказа от фиксации схемы кодирования (Unlatch) не кодируют, его наличие подразумевается перед последним знаком символа.
Во всех остальных случаях либо используют знак отказа от фиксации схемы кодирования (Unlatch) для выхода из схемы кодирования С40 перед окончанием символа, либо применяют символ большего размера для кодирования данных.
5.2.5.3 Использование знака верхнего регистра (Upper Shift) в схеме кодирования С40
В схеме кодирования С40 знак верхнего регистра (Upper Shift) не является функциональным знаком символики, а используется как знак регистра (Shift) внутри данного кодового набора. Для кодирования знаков расширенного набора ASCII (КОИ-8) с десятичными значениями от 128 до 255 необходимо закодировать три или четыре значения С40 в соответствии со следующими требованиями.
Если [десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128] принадлежит основному набору, то используют запись:
[1 (значение знака Регистр 2 (Shift))] [30 (значение знака верхнего регистра (UperShift))] [V (десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128)].
В противном случае запись приобретает следующий вид:
[1 (значение знака Регистр 2)] [30 (значение знака верхнего регистра)] [0, 1 или 2 (значения знаков Регистр 1, 2 или 3)] [V (десятичное значение знака расширенного набора ASCII (КОИ-8) минус 128)].
В данных записях число, приведенное в квадратных скобках, соответствует значению согласно приложению С.1, соответствующее значение С40 обозначено V.
5.2.6 Схема кодирования Text
Схема кодирования Text предназначена для кодирования обычного печатного текста, состоящего в основном из знаков нижнего регистра (строчных букв латинского алфавита, цифр, знака ПРОБЕЛ). По структуре она похожа на кодовый набор, используемый в схеме кодирования С40, за исключением того, что строчные буквы нижнего регистра кодируют напрямую (без переключения регистра). Знаки верхнего регистра (прописные буквы латинского алфавита, цифры, специальные графические знаки и знак ПРОБЕЛ) предваряют знаком регистра 3. Полный кодовый набор знаков схемы кодирования Text приведен в приложении С (таблица С.2).
5.2.6.1 Переключение на схему кодирования Text и обратно
На схему кодирования Text можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования с десятичным значением 239. Кодовое слово значением 254, непосредственно следующее за парой кодовых слов в схеме кодирования Text, действует как кодовое слово отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). В противном случае схема кодирования Text действует до окончания данных, кодируемых в символе.
5.2.6.2 Правила кодирования в схеме кодирования Text
Применяют те же правила, что и в схеме кодирования С40.
5.2.7 Схема кодирования ANSI X12
Схему кодирования ANSI X12 применяют для кодирования знаков, используемых при стандартном электронном обмене данными по ANSI X12, в которой три знака данных размещают с уплотнением в двух кодовых словах и которая в некоторой степени подобна схеме кодирования С40. Схема кодирования ANSI Х12 позволяет кодировать буквы верхнего регистра (прописные латинские буквы), цифры, знак ПРОБЕЛ и три стандартных ограничительных и разделительных знака в соответствии с ANSI X12. Соответствие кодов по ANSI X12 приведено в таблице 4. В наборе кодируемых знаков по ANSI X12 отсутствуют знаки регистра (Shift).
Таблица 4 - Набор кодируемых знаков по ANSI X12
|
|
|
Значение знака Х12 | Кодируемые знаки | Десятичные значения знака ASCII (КОИ-7) |
0 | Х12 ограничитель сегмента <CR> | 13 |
1 | Х12 разделитель сегментов * (ЗВЕЗДОЧКА) | 42 |
2 | Х12 разделитель подэлементов > (БОЛЬШЕ) | 62 |
3 | ПРОБЕЛ | 32 |
4-13 | от 0 до 9 | 48-57 |
14-39 | от А до Z | 65-90 |
________________
5.2.7.1 Переключение на схему кодирования ANSI X12 и обратно
На схему кодирования ANSI X12 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования (Latch) (значение 238). Кодовое слово значением 254, непосредственно следующее за парой кодовых слов схемы кодирования ANSI X12, действует как кодовое слово отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). В противном случае схема кодирования ANSI X12 действует до окончания данных, кодируемых в символе.
5.2.7.2 Правила кодирования в соответствии со схемой кодирования ANSI X12
Применяют правила, установленные для схемы кодирования С40. Исключение составляет окончание кодирования данных ANSI X12. Если знаки данных не полностью заполняют пары кодовых слов, то сразу за последней полной парой кодовых слов следует использовать переключение в схему кодирования ASCII (КОИ-7/КОИ-8) с помощью кодового слова значением 254 и продолжить использование схемы кодирования ASCII (КОИ-7/КОИ-8) за исключением случая, когда остается единственный конечный знак символа (кодовое слово) перед первым кодовым словом исправления ошибки. Этот единственный знак символа кодируется по схеме кодирования ASCII (КОИ-7/КОИ-8) без использования кодового слова отказа от фиксации (Unlatch).
5.2.8 Схема кодирования EDIFACT
Схема кодирования EDIFACT включает в себя 63 знака КОИ-7 (ASCII) с десятичными значениями от 32 до 94, а также знак отказа от фиксации (двоичное значение 011111) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). Схема кодирования EDIFACT позволяет кодировать четыре знака данных в трех кодовых словах. Знаки данных включают в себя все цифры, буквы латинского алфавита и специальные графические знаки (знаки пунктуации), определенные в наборе знаков "EDIFACT Level А" без знаков регистра (Shift), используемых в схеме кодирования С40.
5.2.8.1 Переключение на схему кодирования EDIFACT и обратно
На схему кодирования EDIFACT можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования (Latch) значением 240. Знак отказа от фиксации в схеме кодирования EDIFACT следует использовать в качестве ограничителя окончания схемы кодирования EDIFACT для возврата в схему кодирования ASCII (КОИ-7/КОИ-8).
5.2.8.2 Правила кодирования в соответствии со схемой кодирования EDIFACT
Набор знаков в схеме кодирования EDIFACT приведен в приложении С, таблица С.З. Существует простое соответствие между 6-битовыми значениями знаков по EDIFACT и 8-битовыми байтами знака расширенного набора ASCII (КОИ-8). При построении 6-битового значения знака по EDIFACT исключают два бита старших разрядов 8-битового байта в соответствии с рисунком 3. Строки из четырех знаков со значениями по EDIFACT кодируют в три кодовых слова. В процессе простого кодирования два бита старших разрядов удаляют из 8-битового байта. Оставшийся 6-битовый байт является значением по EDIFACT и должен быть непосредственно закодирован в кодовом слове (рисунок 4).
|
|
|
|
Знак данных
| Значение знака расширенного набора ASCII (КОИ-8) | Значение знака по EDIFACT | |
| Десятичное значение
| 8-битовое двоичное значение |
|
А | 65 | 01000001 | 000001 |
9 | 57 | 00111001 | 111001 |
Примечание - В процессе декодирования, если начальный бит (6-й разряд) равен 1, то для построения 8-битового байта требуется вставить в качестве префикса биты 00. Если начальный бит (6-й разряд) равен нулю, то для построения 8-битового байта надо вставить в качестве префикса биты 01. Исключением является знак со значением по EDIFACT 011111, который является управляющим знаком символики отказа от фиксации (Unlatch) для возврата в схему кодирования ASCII (КОИ-7/КОИ-8). |
Рисунок 3 - Соответствие значений знаков по EDIFACT и значений 8-битовых байтов
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Знаки данных | D | А | Т | А | |||||||||||
Исходные двоичные значения (по таблице С.3) | 00 | 01 | 00 |
| 00 | 00 | 01
|
| 01 | 01 | 00
|
| 00 | 00 | 01
|
Разделение по три 8-битовых байта | 00 | 01 | 00
|
| 00
| 00 | 01 |
| 01 | 01 | 00 |
| 00 | 00 | 01 |
Итоговые значения кодовых слов | 16 | 21 | 1 |
Рисунок 4 - Пример кодирования по EDIFACT
Когда кодирование EDIFACT завершается знаком отказа от фиксации схемы кодирования (Unlatch), любые биты, оставшиеся в одиночном знаке символа, следует заполнять нулями. Схема кодирования ASCII (КОИ-7/КОИ-8) начинается со следующего знака символа. Если схема кодирования EDIFACT действует до конца символа, и до первого знака исправления ошибки осталось закодировать только одно или два кодовых слова, оставшихся за последним триплетом кодовых слов по схеме кодирования EDIFACT, их следует кодировать по схеме кодирования ASCII (КОИ-7/КОИ-8) без использования знака отказа от фиксации (Unlatch).
5.2.9 Схема кодирования по основанию 256
Схему кодирования по основанию 256 используют для кодирования любых 8-битовых байтов данных, включая интерпретации в расширенном канале (ECI), и двоичных данных. Интерпретация, используемая по умолчанию, определена в 5.2.2. Алгоритм рандомизации с шаблоном из 255 состояний применяют к каждой последовательности по основанию 256, встречающейся в закодированных данных (приложение В.2). Схема начинает действовать после знака фиксации схемы кодирования по основанию 256 и заканчивается на последнем знаке, определенном длиной поля в схеме кодирования по основанию 256.
5.2.9.1 Переключение на схему кодирования по основанию 256 и обратно
На схему кодирования по основанию 256 можно переключиться из схемы кодирования ASCII (КОИ-7/КОИ-8), используя соответствующее кодовое слово фиксации схемы кодирования значением 231. По окончании данных, закодированных в соответствии со схемой кодирования по основанию 256, возврат к схеме кодирования ASCII (КОИ-7/КОИ-8) осуществляется автоматически. Обращение к интерпретации в расширенном канале (ECI), отличающейся от принятой по умолчанию, должно быть выполнено до переключения на схему кодирования по основанию 256. Последовательность ECI не требуется располагать непосредственно перед переключением в схему кодирования по основанию 256.
5.2.9.2 Правила кодирования в соответствии со схемой кодирования по основанию 256
Таблица 5 - Длина поля в схеме кодирования по основанию 256
|
|
|
Длина поля | Значения , | Допустимые значения |
До конца символа | 0 | 0 |
От 1 до 249 | заданная длина | от 1 до 249 |
От 250 до 1555 | (заданная длина DIV 250)+249 | от 250 до 255 |
| заданная длина MOD 250 | от 0 до 249 |
5.3 Рекомендации пользователям
Символика версии ЕСС 200 предлагает гибкие способы кодирования данных. К альтернативным наборам знаков следует обращаться с использованием протокола интерпретации в расширенном канале (ECI). Данные могут быть закодированы в символ квадратной или прямоугольной формы. Если длина сообщения превышает емкость символа, то оно может быть закодировано с использованием последовательности структурированного соединения нескольких (до 16) отдельных, но логически связанных символов версии ЕСС 200 (5.6).
5.3.1 Выбор пользователем интерпретации в расширенном канале (ECI)
Использование альтернативной интерпретации в расширенном канале (ECI) для задания определенной кодовой страницы (набора) или более специфичной интерпретации данных требует вызова дополнительных кодовых слов для активизации этой возможности. Использование протокола интерпретации в расширенном канале (ECI) (5.4) обеспечивает возможность кодирования в данных знаков алфавитов, отличающихся от латинского (по ИСО/МЭК 8859-1 Латинский алфавит N 1), поддерживаемого интерпретацией по умолчанию (последовательность ECI 000003).
5.3.2 Выбор пользователем формы и размера символа
Версия ЕСС 200 имеет двадцать четыре квадратных и шесть прямоугольных конфигураций символа. Можно выбрать подходящий размер и форму символа, в зависимости от требований к его практическому применению; технические требования к данным конфигурациям приведены в 5.5.
5.4 Интерпретация в расширенном канале
Протокол интерпретации в расширенном канале (ECI) позволяет включать в выходной поток данных знаки различных интерпретаций, отличающиеся от набора знаков по умолчанию. Протокол ECI единообразно определен для ряда символик. В символике Data Matrix поддерживаются четыре распространенных типа интерпретаций:
a) международные наборы знаков (или кодовые страницы);
b) интерпретации общего назначения, такие как шифрование и уплотнение;
c) определяемые пользователем интерпретации для замкнутых систем применения;
d) управляющая информация для структурированного соединения в небуферизованном режиме.
Протокол интерпретации в расширенном канале полностью установлен в стандарте AIM Inc. ITS/04-001 "Интерпретации в расширенном канале. Часть 1" ("International Technical Specification - Extended Channel Interpretation - Parth 1"). Протокол обеспечивает последовательный метод установления специфических интерпретаций значений байтов перед печатью и после декодирования. Конкретную интерпретацию в расширенном канале идентифицируют с помощью 6-разрядного числа, которое в символике Data Matrix кодируют знаком ECI, за которым следует от одного до трех кодовых слов. Специальные интерпретации приведены в документе AIM Inc. "Интерпретации в расширенном канале. Часть 3" ("Extended Chanel Interpretations - Part 3 - Register"). Интерпретация в расширенном канале может использоваться только с устройствами считывания, позволяющими передавать идентификаторы символики. Устройства считывания, которые не могут передавать идентификаторы символики, не обеспечивают передачу данных из любого символа, содержащего ECI. Исключение может быть сделано только в случае, если интерпретация в расширенном канале может быть полностью обработана самим устройством считывания.
Протокол интерпретации в расширенном канале используют только в символах версии ЕСС 200. Заданная интерпретация в расширенном канале может быть вызвана в любом месте закодированного сообщения.
5.4.1 Кодирование интерпретации в расширенном канале
Разнообразные схемы кодирования символики Data Matrix версии ЕСС 200 (таблица 1) могут применяться при любой интерпретации в расширенном канале. Вызов ECI может быть осуществлен только из схемы кодирования ASCII (КОИ-7/КОИ-8), после которого допускается переключение между любыми схемами кодирования. Используемый способ кодирования строго определен 8-битовыми значениями данных и он не зависит от действующей ECI. Например последовательность знаков с десятичными значениями в диапазоне от 48 до 57 может быть наиболее эффективно закодирована в цифровом режиме, даже если они не будут интерпретироваться как числа. Назначение ECI вводят с помощью кодового слова значением 241 (знак ECI) в схеме кодирования ASCII (КОИ-7/КОИ-8). Одно, два или три дополнительных кодовых слова используют для кодирования номера назначения ECI (ECI Assignment member). Правила кодирования приведены в таблице 6.
Таблица 6 - Кодирование номеров назначения ECI в символике версии ЕСС 200
|
|
|
|
Номер назначения ECI | Последовательность кодовых слов | Значения кодовых слов | Область значений |
От 000000 до 000126 | 241 |
| |
| ЕСI_nо +1* | (от 1 до 127) | |
От 000127 до 016382 | 241 |
| |
| (ЕСI_no - 127)div254+128 | (от 128 до 191) | |
| (ЕСI_nо - 127) mod 254+1 | (от 1 до 254) | |
От 0016383 до 999999 | 241 |
| |
| (ЕС1_no - 16383)div64516+192 | (от 192 до 207) | |
| [(ЕСI_no - 16383) div 254] mod 254+1 | (от 1 до 254) | |
| (ЕСI_no - 16383) mod 254+1 | (от 1 до 254) |
________________
* ECl_nо +1 - заданный номер назначения ECI.
Следующие примеры приведены для иллюстрации кодирования:
номер назначения ECI=015000
Кодовые слова:
[241][(15000-127) div 254+128][(15000-127) mod 254+1]=[241][58+128][141+1]=[241][186][142]
номер назначения ECI=090000
Кодовые слова:
[241][(90000-16383) div 64516+192][((90000-16383) div 254) mod 254+1][(90000-16383) mod 254+1]=[241][1+192][289 mod 254+1][211+1]=[241][193][36][212]
5.4.2 ECI и структурированное соединение
ECI могут появляться в любом месте сообщения, закодированного в одиночном символе или в символе структурированного соединения (5.6) набора символов Data Matrix. Любая активизированная ECI сохраняет действие либо до конца закодированных данных, либо до появления другой ECI. Таким образом, интерпретация в заданной ECI может распространяться на два или более символов.
5.4.3 Протокол после декодирования
Протокол передачи данных ECI определен в 11.4. При применении интерпретаций в расширенном канале следует использовать идентификаторы символики (11.5) и соответствующий идентификатор символики должен передаваться перед декодированными данными.
5.5 Атрибуты символа версии ЕСС 200
5.5.1 Размер и емкость символа
В символике версии ЕСС 200 доступны 24 квадратных и 6 прямоугольных символов, указанные в таблице 7.
Таблица 7 - Атрибуты символов ЕСС 200
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| |||
Размер* символа | Область данных | Размер коор- динат- ной мат- рицы | Общее число кодовых слов | Число кодовых слов в блоке Рида- Соломона | Число чере- дую- щихся блоков | Максимальная емкость символа для данных | Кодо- вые слова исп- рав- ле- ния оши- бок, % | Мак- сима- льное число восста- новлен- ных кодовых слов**, ошибок/ сти- раний | ||||||||||||||||
Число строк | Число столб- цов | Раз- мер | Чис- ло об- лас- тей дан- ных |
| дан- ных | исп- рав- ле- ния оши- бок | дан- ных | исп- рав- ле- ния оши- бок |
| чис- ло чис- ло- вых раз- ря- дов | число латин- ских букв и цифр**** | чис- ло бай- тов |
|
| ||||||||||
Символы квадратной формы | ||||||||||||||||||||||||
10 | 10 | 8x8 | 1 | 8x8 | 3 | 5 | 3 | 5 | 1 | 6 | 3 | 1 | 62,5 | 2/0 | ||||||||||
12 | 12 | 10x10 | 1 | 10x10 | 5 | 7 | 5 | 7 | 1 | 10 | 6 | 3 | 58,3 | 3/0 | ||||||||||
14 | 14 | 12x12 | 1 | 12x12 | 8 | 10 | 8 | 10 | 1 | 16 | 10 | 6 | 55,6 | 5/7 | ||||||||||
16 | 16 | 14x14 | 1 | 14x14 | 12 | 12 | 12 | 12 | 1 | 24 | 16 | 10 | 50 | 6/9 | ||||||||||
18 | 18 | 16x16 | 1 | 16x16 | 18 | 14 | 18 | 14 | 1 | 36 | 25 | 16 | 43,8 | 7/11 | ||||||||||
20 | 20 | 18x18 | 1 | 18x18 | 22 | 18 | 22 | 18 | 1 | 44 | 31 | 20 | 45 | 9/15 | ||||||||||
22 | 22 | 20x20 | 1 | 20x20 | 30 | 20 | 30 | 20 | 1 | 60 | 43 | 28 | 40 | 10/17 | ||||||||||
24 | 24 | 22x22 | 1 | 22x22 | 36 | 24 | 36 | 24 | 1 | 72 | 52 | 34 | 40 | 12/21 | ||||||||||
26 | 26 | 24x24 | 1 | 24x24 | 44 | 28 | 44 | 28 | 1 | 88 | 64 | 42 | 38,9 | 14/25 | ||||||||||
32 | 32 | 14x14 | 4 | 28x28 | 62 | 36 | 62 | 36 | 1 | 124 | 91 | 60 | 36,7 | 18/33 | ||||||||||
36 | 36 | 16x16 | 4 | 32x32 | 86 | 42 | 86 | 42 | 1 | 172 | 127 | 84 | 32,8 | 21/39 | ||||||||||
40 | 40 | 18x18 | 4 | 36x36 | 114 | 48 | 114 | 48 | 1 | 228 | 169 | 112 | 29,6 | 24/45 | ||||||||||
44 | 44 | 20x20 | 4 | 40x40 | 144 | 56 | 144 | 56 | 1 | 288 | 214 | 142 | 28 | 28/53 | ||||||||||
48 | 48 | 22x22 | 4 | 44x44 | 174 | 68 | 174 | 68 | 1 | 348 | 259 | 172 | 28,1 | 34/65 | ||||||||||
52 | 52 | 24x24 | 4 | 48x48 | 204 | 84 | 102 | 42 | 2 | 408 | 304 | 202 | 29,2 | 42/78 | ||||||||||
64 | 64 | 14x14 | 16 | 56х56 | 280 | 112 | 140 | 56 | 2 | 560 | 418 | 277 | 28,6 | 56/106 | ||||||||||
72 | 72 | 16x16 | 16 | 64x64 | 368 | 144 | 92 | 36 | 4 | 736 | 550 | 365 | 28,1 | 72/132 | ||||||||||
80 | 80 | 18x18 | 16 | 72x72 | 456 | 192 | 114 | 48 | 4 | 912 | 682 | 453 | 29,6 | 96/180 | ||||||||||
88 | 88 | 20x20 | 16 | 80x80 | 576 | 224 | 144 | 56 | 4 | 1152 | 862 | 573 | 28 | 112/212 | ||||||||||
96 | 96 | 22x22 | 16 | 88x88 | 696 | 272 | 174 | 68 | 4 | 1392 | 1042 | 693 | 28,1 | 136/260 | ||||||||||
104 | 104 | 24x24 | 16 | 96x96 | 816 | 336 | 136 | 56 | 6 | 1632 | 1222 | 813 | 29,2 | 168/318 | ||||||||||
120 | 120 | 18x18 | 36 | 108x108 | 1050 | 408 | 175 | 68 | 6 | 2100 | 1573 | 1047 | 28 | 204/390 | ||||||||||
132 | 132 | 20x20 | 36 | 120x120 | 1304 | 496 | 163 | 62 | 8 | 2608 | 1954 | 1301 | 27,6 | 248/472 | ||||||||||
144 | 144 | 22x22 | 36 | 132x132 | 1558 | 620 | 156 | 62 | 8*** | 3116 | 2335 | 1555 | 28,5 | 310/590 | ||||||||||
|
|
|
|
|
|
| 155 | 62 | 2*** |
|
|
|
|
| ||||||||||
Символы прямоугольной формы | ||||||||||||||||||||||||
8 | 18 | 6x16 | 1 | 6x16 | 5 | 7 | 5 | 7 | 1 | 10 | 6 | 3 | 58,3 | 3/0 | ||||||||||
8 | 32 | 6x14 | 2 | 6x28 | 10 | 11 | 10 | 11 | 1 | 20 | 13 | 8 | 52,4 | 5/0 | ||||||||||
12 | 26 | 10x24 | 1 | 10x24 | 16 | 14 | 16 | 14 | 1 | 32 | 22 | 14 | 46,7 | 7/11 | ||||||||||
12 | 36 | 10x16 | 2 | 10x32 | 22 | 18 | 22 | 18 | 1 | 44 | 31 | 20 | 45,0 | 9/15 | ||||||||||
16 | 36 | 14x16 | 2 | 14x32 | 32 | 24 | 32 | 24 | 1 | 64 | 46 | 30 | 42,9 | 12/21 | ||||||||||
16 | 48 | 14x22 | 2 | 14x44 | 49 | 28 | 49 | 28 | 1 | 98 | 72 | 47 | 36,4 | 14/25 | ||||||||||
* размер символа не включена свободная зона.
** По 5.7.3.
*** В символе наибольшего размера (144x144) первые восемь блоков по Риду-Соломону включают в 218 кодовых слов, кодирующих 156 кодовых слов данных. Последние два блока включают 217 кодовых слов (155 слов данных). Все блоки содержат 62 кодовых слова исправления ошибок.
**** В соответствии с правилами схем кодировании Text или С40 без использования знаков фиксации и регистра; при кодировании с помощью других схем это значение может значительно варьироваться в зависимости от сочетания и группирования наборов знаков. |
5.5.2 Включение направляющих шаблонов в символы большого размера
Согласно таблице 7 символы квадратной формы, размерами (в модулях) 32х32 и более, и четыре прямоугольных символа размерами (в модулях) 8х32, 12х36, 16х36 и 16х48 имеют две или более области данных (data regions). Эти области данных ограничивают направляющими шаблонами (приложение D). Символы квадратной формы делят на 4, 16 или 36 областей данных (приложение D, рисунки D.1, D.2 и D.3). Прямоугольные символы делят на две области данных (приложение D, рисунок D.4). Чередующиеся темные модули направляющего шаблона должны быть расположены на верхней и правой границах области данных и идентифицировать четные столбцы и строки.
5.6 Структурированное соединение
5.6.1 Основные принципы
В структурированном формате может присутствовать до 16 символов версии ЕСС 200 для кодирования сообщения большого объема. Символ является частью структурированного соединения, что отмечается кодовым словом значением 233 в позиции первого знака символа. Непосредственно за ним следуют три кодовых слова структурированного соединения. Первое кодовое слово является индикатором позиции символа в группе, второе и третье предназначены для идентификация файла.
5.6.2 Индикатор позиции символа
Таблица 8 - Значения битов позиции символа в структурированном соединении
|
|
|
|
Позиция символа | Значения битов с 1 по 4 | Общее число символов | Значения битов с 5 по 8 |
1 | 0000 |
|
|
2 | 0001 | 2 | 1111 |
3 | 0010 | 3 | 1110 |
4 | 0011 | 4 | 1101 |
5 | 0100 | 5 | 1100 |
6 | 0101 | 6 | 1011 |
7 | 0110 | 7 | 1010 |
8 | 0111 | 8 | 1001 |
9 | 1000 | 9 | 1000 |
10 | 1001 | 10 | 0111 |
11 | 1010 | 11 | 0110 |
12 | 1011 | 12 | 0101 |
13 | 1100 | 13 | 0100 |
14 | 1101 | 14 | 0011 |
15 | 1110 | 15 | 0010 |
16 | 1111 | 16 | 0001 |
Пример - Порядок кодирования кодового слова индикатора позиции символа для третьего символа в группе из семи символов:
Значение битов в третьей позиции символа: 0010
Общее число символов 7:1010
Комбинация битов: 00101010
Значение кодового слова: 42
5.6.3 Идентификация файла
Идентификацию файла задают значениями двух кодовых слов. Каждое кодовое слово идентификации файла может иметь значение от 1 до 254, что допускает 64516 различных вариантов идентификации файла. Идентификация файла предназначена для повышения вероятности того, что только логически связанные символы обрабатываются как часть единого сообщения.
5.6.4 Структурированное соединение и знак FNC1
Если структурированное соединение используется в сочетании со знаком FNC1 (5.2.4.6), то первые четыре кодовых слова следует применять для структурированного соединения, а пятое и шестое доступны для использования знака FNC1. Знак FNС1 не должен повторяться в этих же позициях во втором и последующем символах, если только он не используется в качестве разделителя полей.
5.6.5 Буферизованные и небуферизованные операции
Сообщение, содержащееся в рамках последовательности структурированного соединения, может быть целиком накоплено в буфере устройства считывания до своего полного ввода и передано после того, как считаны все символы. В качестве альтернативы устройство считывания может передавать декодированные данные из каждого символа по мере их считывания. В этой небуферизованной операции протокол ECI для структурированного соединения, установленный в стандарте AIM ITS 04/001, часть 1, определяет управляющий блок, который должен вставляться в качестве префикса перед началом передаваемых данных каждого символа.
5.7 Обнаружение и исправление ошибок
5.7.1 Исправление ошибок Рида-Соломона
В символах версии ЕСС 200 используют исправление ошибок Рида-Соломона.
Для символов версии ЕСС 200 с общим числом кодовых слов менее 255 кодовые слова исправления ошибки вычисляют с помощью кодовых слов данных без процедуры чередования.
Для символов версии ЕСС 200 с общим числом кодовых слов более 255 кодовые слова исправления ошибки вычисляют с помощью кодовых слов данных с использованием процедуры чередования (приложение А). Каждый символ версии ЕСС 200 характеризуется особым числом кодовых слов данных и исправления ошибок, которые разделены в определенном числе блоков (таблица 7) и к которым применяется процедура чередования (приложение А).
5.7.2 Генерация кодовых слов исправления ошибок
Рисунок 5 - Схема генерации кодовых слов исправления ошибки
5.7.3 Возможности исправления ошибок
Кодовые слова исправления ошибок позволяют исправлять два типа ошибочных кодовых слов: стирания (ошибочные кодовые слова с известными позициями) и ошибки (ошибочные кодовые слова с неизвестными позициями). Стирание представляет собой не сканированный или не поддающийся декодированию знак символа. Ошибка представляет собой неправильно декодированный знак символа. Число стираний и ошибок, которые одновременно можно исправить, вычисляют по следующей формуле
5.8 Формирование символа
При заданной последовательности кодовых слов, рассмотренной в предыдущих разделах, символ версии ЕСС 200 формируется следующим образом:
a) размещение модулей кодовых слов в координатной матрице;
b) подстановка модулей направляющего шаблона, при необходимости;
c) размещение модулей шаблона поиска по периметру символа.
5.8.1 Размещение знаков символа
Каждый знак символа должен включать в себя восемь номинально квадратных модулей, каждый из которых отображает один двоичный разряд. Темный модуль соответствует единице, светлый - нулю. Восемь модулей, упорядоченных слева-направо и сверху-вниз составляют форму знака символа (рисунок 6). Вследствие того, что форма знака символа (рисунок 6) не может точно вписаться в границы символа, некоторые знаки символа разбивают на части. Порядок размещения знаков символа определен программой на языке программирования С (приложение F).
LSB - младший значащий разряд (Least significant bit); MSB - старший значащий разряд (Most significant bit)
Рисунок 6 - Представление кодового слова в знаке символа версии ЕСС 200
5.8.2 Размещение модулей направляющего шаблона (Alinement Pattern)
Этот этап применяют только для крупных матриц квадратной формы размерами (в модулях) от 32х32 и более, а также прямоугольной формы размерами (в модулях) от 8х32, 12х36 и более. Для выбранного формата символа координатную матрицу разбивают на области данных размерами, установленными в таблице 7. Области данных отделяют друг от друга направляющими шаблонами шириной два модуля. В результате некоторые знаки символа будут разделены между двумя смежными областями данных. Для матриц квадратной формы направляющие шаблоны размещают между областями данных горизонтально и вертикально парами. Общее число пар направляющих шаблонов 2, 6 или 10 (приложение D, рисунки D.1-D.3). Для матриц прямоугольной формы между областями данных размещают только один вертикальный направляющий шаблон (приложение D, рисунок D.4).
5.8.3 Размещение модулей шаблона поиска (Finder Pattern)
Для формирования шаблона поиска модули следует размещать по периметру матрицы (4.3.1).
6 Требования к символам версии ЕСС 000-140
6.1 Рекомендации по применению
Для разрабатываемых прикладных приложений и открытых систем рекомендуется использовать символику версии ЕСС 200 (раздел 5). Неизвестны случаи, когда символы версии ЕСС 200 были бы менее устойчивыми к повреждениям, чем символы версии ЕСС 000-140 того же размера.
6.2 Порядок кодирования
В настоящем подразделе приведено общее описание порядка кодирования, в следующих подразделах - более подробное описание. Пример кодирования для символа уровня ЕСС 050 приведен в приложении Q.
Преобразование данных пользователя в символ версии ЕСС 000-140 проводят в следующем порядке:
Этап 1. Кодирование данных
Проводят анализ входных данных пользователя для определения совокупности различных типов знаков, подлежащих кодированию. Для максимальной эффективности уплотнения должна быть выбрана оптимальная схема кодирования самого низкого уровня, способная закодировать данные. Если пользователь не устанавливает размер матрицы, то выбирают наименьший размер для размещения данных. Результатом этого этапа является двоичный поток закодированных данных (Encoded Data Bit Stream).
Этап 2. Формирование префикса данных
Двоичный поток префикса данных формируют из поля идентификатора формата, поля величины контроля циклической избыточности (CRC) и двоичного поля длины данных. Указанный двоичный поток префикса данных добавляют в виде префикса к двоичному потоку закодированных данных для создания незащищенного двоичного потока (Unprotected Data Bit Stream).
Этап 3. Обнаружение и исправление ошибок
Обрабатывают незащищенный двоичный поток в соответствии с установленным пользователем алгоритмом сверточного кодирования для создания защищенного двоичного потока (Protected Bit Stream). Этот этап не выполняют для символов уровня ЕСС 000.
Этап 4. Построение головной и конечной меток
К защищенному двоичному потоку добавляют в виде префикса головную метку, содержащую только двоичное поле контроля и исправления ошибок (ЕСС). К защищенному двоичному потоку присоединяют также конечную метку, содержащую биты-заполнители (нулевые биты). Защищенный двоичный поток, к которому добавлены головная и конечная метки, называют нерандомизированным двоичным потоком (Unrandomised Bit Stream).
Этап 5. Шаблонная рандомизация
Нерандомизированный двоичный поток обрабатывают с помощью алгоритма рандомизации и создают рандомизированный двоичный поток (Randomised Bit Stream).
Этап 6. Размещение модулей в матрице
Модули размещают в матрице так, чтобы образовался шаблон поиска. Рандомизированный двоичный поток размещают в матрице помодульно в соответствии с алгоритмом размещения модулей данных (приложение Н). Различные двоичные потоки в процессе кодирования приведены на рисунке 7.
Рисунок 7 - Двоичные потоки в процессе кодирования символов версии ЕСС 000-140
6.3 Кодирование данных
Данные должны быть закодированы с использованием одной из шести схем кодирования (таблица 9). Схему кодирования устанавливают для всего символа, поэтому выбор наиболее подходящей схемы кодирования может значительно влиять на число битов, необходимых для кодирования исходных данных. Одни и те же данные могут быть представлены в символах версии ЕСС 000-140 различными способами путем использования различных схем кодирования. Наборы знаков для всех схем кодирования, за исключением схемы с 8-битовыми байтами, приведены в приложении I. Схему кодирования с 8-битовыми байтами определяет пользователь. Наиболее эффективной схемой кодирования для использования является схема с наименьшим основанием, с помощью которой можно закодировать все знаки сообщения. Таким образом, если все знаки могут быть закодированы по схеме кодирования по основанию 27, неэффективно использовать схемы кодирования по основаниям 37 и 41 или схему кодирования ASCII (КОИ-7/КОИ-8).
Таблица 9 - Схемы кодирования для символов версии ЕСС 000-140
|
|
|
Схема кодирования | Знаки | Число битов на один знак |
По основанию 11 | Цифровые данные | 3,5 |
По основанию 27 | Прописные буквы | 4,8 |
По основанию 37 | Прописные буквы и цифры | 5,25 |
По основанию 41 | Прописные буквы, цифры и специальные графические знаки | 5,5 |
ASCII (КОИ-7) | Полный набор 128 знаков ASCII (КОИ-7) | 7 |
8-битовый байт | Определяются пользователем | 8 |
Чтобы определить наиболее подходящую схему кодирования, необходимо проанализировать данные, предназначенные для кодирования. Наборы знаков каждой из схем кодирования с основанием N необходимо последовательно сравнивать с набором знаков, подлежащих кодированию, начиная с набора знаков схемы кодирования по основанию 11. Если данный набор знаков подходит, то следует использовать именно его, если нет, то сравнение должно быть продолжено для наборов знаков схем кодирования по основаниям 27, 37 и 41 до тех пор, пока не будет определена подходящая схема с наименьшим числом в основании. Если знаки данных выходят за пределы возможностей набора знаков схемы кодирования по основанию 41, то необходимо использовать набор знаков ASCII (КОИ-7), пока знаки не выходят за установленные пределы, в противном случае следует использовать набор 8-битовых байтов.
Для всех схем кодирования каждую уплотненную последовательность от 4 до 24 битов длиной размещают в двоичном потоке закодированных данных в обратном порядке, начиная с самого младшего двоичного разряда в первой позиции, т.е. формируют каждую отдельную уплотненную последовательность, затем порядок меняют на обратный и добавляют в двоичный поток закодированных данных, т.е. формируют полный уплотненный двоичный поток, который затем (как целое) меняет порядок на обратный.
Подробности каждой схемы кодирования приведены в следующих подпунктах.
6.3.1 Схема кодирования по основанию 11 - кодирование цифр
В схеме кодирования по основанию 11 (цифры) кодируют шесть знаков данных как 21 бит с плотностью кодирования 3,5 битов на один знак данных. Кодируемый набор знаков схемы кодирования по основанию 11 позволяет кодировать следующие 11 знаков:
- цифры от 0 до 9;
- знак ПРОБЕЛ.
Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 11 в соответствии с приложением I. На втором этапе должно быть произведено уплотнение кодовых значений по основанию 11 путем преобразования от схемы кодирования по основанию 11 к схеме кодирования по основанию 2 (приложение I, раздел I.1).
6.3.2 Схема кодирования по основанию 27 - кодирование прописных букв
В схеме кодирования по основанию 27 (прописные буквы) кодируют пять знаков данных в 24 битах с плотностью кодирования 4,8 битов на один знак данных. Кодируемый набор знаков по основанию 27 позволяет кодировать следующие 27 знаков:
- прописные латинские буквы от А до Z;
- знак ПРОБЕЛ.
Кодирование данных проводят в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 27 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 27 путем преобразования от схемы кодирования по основанию 27 к схеме кодирования по основанию 2 (приложение I, раздел I.2).
6.3.3 Схема кодирования по основанию 37 - кодирование прописных букв и цифр
В схеме кодирования по основанию 37 (прописные буквы и цифры) кодируют четыре знака данных в 21 бите с плотностью кодирования 5,25 битов на один знак данных. Кодируемый набор знаков по основанию 37 позволяет кодировать следующие 37 знаков:
- прописные латинские буквы от А до Z;
- цифры от 0 до 9;
- знак ПРОБЕЛ.
Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 37 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 37 путем преобразования от схемы кодирования по основанию 37 к схеме кодирования по основанию 2 (приложение I, раздел I.3).
6.3.4 Схема кодирования по основанию 41 - кодирование прописных букв, цифр и специальных графических знаков
В схеме кодирования по основанию 41 (прописные буквы, цифры и специальные графические знаки) кодируют четыре знака данных в 22 битах с плотностью кодирования 5,5 битов на один знак данных. Кодируемый набор знаков по основанию 41 позволяет кодировать следующий 41 знак:
- прописные латинские буквы от А до Z;
- цифры от 0 до 9;
- знак ПРОБЕЛ;
. (ТОЧКА);
, (ЗАПЯТАЯ);
- (МИНУС или ДЕФИС);
/ (ДРОБНАЯ ЧЕРТА).
Данные кодируют в два этапа. На первом этапе фактические знаки данных должны быть заменены их кодовыми значениями по основанию 41 (приложение I). На втором этапе должно быть произведено уплотнение кодовых значений по основанию 41 путем преобразования от схемы кодирования по основанию 41 к схеме кодирования по основанию 2 (приложение I, раздел I.4).
6.3.5 Схема кодирования ASCII (КОИ-7)
В схеме кодирования ASCII (КОИ-7) кодируют все 128 знаков по ИСО/МЭК 646*. Каждый знак данных кодируют как 7-битовый байт, эквивалентный десятичному значению, приведенному в приложении I, таблице I.1, графе ASCII (КОИ-7).
________________
* Набор знаков по ANSI INCITS 4-1986 (R2007) Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII) (Информационные системы - Кодированные наборы знаков - 7-битовый американский национальный стандартный код для обмена информацией (7-битовый ASCII).
6.3.6 Схема кодирования 8-битовыми байтами
Схему кодирования 8-битовыми байтами используют в замкнутых прикладных системах, где интерпретацию данных определяет пользователь. Каждый знак данных должен кодироваться как 8-битовый байт.
6.4 Выбор пользователем уровня исправления ошибок
6.4.1 Выбор уровня исправления ошибок
Символы версии ЕСС 000-140 предлагают пять уровней исправления ошибок на основе использования сверточных кодов (таблица 10). В прикладных системах применения важно понимать, что повышение уровня исправления ошибок приводит к пропорциональному увеличению числа битов в выходном сообщении (и, следовательно, к увеличению размера символа) и обеспечивает различные уровни исправления ошибок.
Таблица 10 - Уровень исправления ошибок, уровень повреждений и увеличение числа битов
|
|
|
Уровень кода исправления ошибок | Максимально возможный уровень повреждений, % | Увеличение числа битов пользователя к ЕСС 000, % |
000 | Отсутствует | Отсутствует |
050 | 2,8 | 33 |
080 | 5,5 | 50 |
100 | 12,6 | 100 |
140 | 25 | 300 |
6.4.2 Прочие уровни исправления ошибок на основе алгоритмов сверточных кодов
До публикации настоящего стандарта в Data Matrix в прикладных применениях использовались иные уровни исправления ошибок, основанные на алгоритмах сверточного кодирования. Информация нетиповых уровнях исправления ошибок доступна в AIM Inc. Символы с подобными уровнями исправления ошибок не соответствуют требованиям настоящего стандарта.
6.5 Формирование незащищенного двоичного потока
На рисунке 7 показано, что незащищенный двоичный поток имеет префикс данных двоичного потока в виде префикса к кодированным битам данных. Определения составляющих частей префикса данных двоичного потока приведены в следующих пунктах.
6.5.1 Двоичное поле идентификатора формата
Идентификатор формата определяет схему кодирования данных. Идентификатор формата имеет десятичное значение для целей определения и 5-битовую величину сегмента для кодирования (таблица 11).
Таблица 11 - Кодирование идентификатора формата
|
|
|
Идентификатор формата | Схема кодирования | Значение 5-битового сегмента |
|
| MSB LSB |
1 | По основанию 11 | 00000 |
2 | По основанию 27 | 00001 |
3 | По основанию 41 | 00010 |
4 | По основанию 37 | 00011 |
5 | ASCII (КОИ-7) | 00100 |
6 | 8-битовых байтов | 00101 |
6.5.2 Двоичное поле контроля циклической избыточности (CRC)
Двоичное поле контроля циклической избыточности (CRC) генерируют с помощью алгоритма CRC. Значение CRC генерируется перед началом кодирования из исходных данных пользователя, представленных в виде 8-битовых байтов, и поэтому используется для независимого контроля ошибок данных пользователя. Полное описание процедуры генерирования значения CRC приведено в приложении J.
6.5.3 Двоичное поле длины данных
Двоичное поле длины данных имеет размер 9 битов и представляет в двоичном виде число кодируемых знаков данных пользователя.
6.5.4 Построение префикса данных
Двоичный поток префикса данных имеет длину 30 битов и формируется в соответствии с рисунком 8.
Рисунок 8 - Структура префикса двоичного потока данных
Примечание - Некоторые двоичные поля начинаются с самого старшего разряда (MSB), другие - с самого младшего разряда (LSB).
6.5.5 Завершение незащищенного двоичного потока данных
Кодированные двоичные данные добавляют в качестве суффикса к двоичному потоку префикса данных для формирования незащищенного двоичного потока данных.
6.6 Построение нерандомизированного двоичного потока
Нерандомизированный двоичный поток состоит из трех составных частей (рисунок 7):
a) головной метки;
b) защищенного двоичного потока;
c) конечной метки.
Формирование указанных составных частей проводят в соответствии с требованиями, приведенными в следующих пунктах.
6.6.1 Построение головной метки
Головная метка нерандомизированного двоичного потока содержит двоичное поле кода исправления ошибок (ЕСС), которое определяет структуру сверточного кода, используемого для защиты данных, закодированных в символе. Двоичное поле кода исправления ошибок (ЕСС) имеет в длину 7 или 19 битов (таблица 12).
Таблица 12 - Двоичное поле кода исправления ошибок (ЕСС)
|
|
|
|
|
Уровень кода исправления ошибок | Идентификатор двоичного сегмента | |||
|
| MSB | LSB |
|
000 | 1111110 |
| ||
050 | 0001110000000001110 |
| ||
080 | 1110001110000001110 |
| ||
100 | 1111111110000001110 |
| ||
140 | 1111110001110001110 |
|
6.6.2 Применение сверточного кодирования для создания защищенного двоичного потока
Необходимо выбрать один из пяти уровней исправления ошибок. Критерии выбора приведены в 6.4. Для символа уровня ЕСС 000 не применяют ни один из уровней исправления ошибок, поэтому незащищенный двоичный поток автоматически становится защищенным двоичным потоком. Для прочих четырех уровней исправления ошибок применяют сверточное кодирование, что приводит к увеличению места, занимаемого входными данными, пропорционально по всей длине. Обработка незащищенного двоичного потока на соответствующем конечном автомате исправления ошибок и считывание результата должны создавать кодированный двоичный поток. Схемы четырех конечных автоматов для символов версии ЕСС 050-140 приведены в приложении К.
6.6.3 Построение конечной метки
К защищенному двоичному потоку добавляют конечную метку, содержащую биты-заполнители (нули). Биты-заполнители должны быть добавлены в конец двоичного потока для обеспечения того, чтобы квадратный корень общего числа битов в нерандомизированном двоичном потоке был равен нечетному целому числу в интервале от 7 до 47. Эта процедура обеспечивает квадратную форму символа.
6.6.4 Построение нерандомизированного двоичного потока
Защищенный двоичный поток с головной и конечной метками называют нерандомизированным двоичным потоком (рисунок 7).
6.7 Шаблонная рандомизация
Нерандомизированный двоичный поток обрабатывают с применением алгоритма шаблонной рандомизации, в результате чего возникает рандомизированный двоичный поток. Алгоритм шаблонной рандомизации включает в себя операцию поразрядного исключающего ИЛИ (XOR), приложенную к нерандомизированному двоичному потоку по всей его длине, и образцу рандомизации двоичного потока (приложение L), начиная с позиции самого старшего двоичного разряда (MSB).
6.8 Размещение модулей в матрице
Размер сторон сетки модулей данных должен быть равен нечетному числу (от 7 до 47), вычисляемому как квадратный корень согласно 6.6.3. Рандомизированный двоичный поток размещают в матрице модуль за модулем в соответствии с сеткой размещения модулей данных (приложение Н). Шаблон поиска (4.3.1) должен быть размещен так, чтобы образовывать внешние границы сетки модулей данных.
7 Размеры символов
7.1 Размеры
Размеры символов Data Matrix должны соответствовать следующим требованиям:
размер X - размер модуля должен быть установлен в стандарте по применению с учетом методов сканирования и технологии нанесения символа;
шаблон поиска - ширина шаблона поиска должна быть равна размеру X,
направляющий шаблон - ширина направляющего шаблона должна быть равна 2Х,
свободная зона - минимальный размер свободной зоны вокруг символа Data Matrix должен быть равен размеру X со всех четырех сторон. Для прикладных систем, в которых необходимо уменьшить влияние областей, расположенных в непосредственной близости от символа, создающих повышенные отражающие помехи, рекомендуется оставлять свободную зону размером от 2Х до 4Х.
8 Качество печати символов
Качество печати символов Data Matrix должно оцениваться в соответствии с требованиями, установленными в ИСО/МЭК 15415 с учетом дополнений и изменений, приведенных в настоящем разделе.
Некоторые методы маркировки не позволяют наносить символы, полностью соответствующие требованиям настоящего стандарта, без применения специальных мер. Дополнительные рекомендации по адаптации любой системы печати для производства требуемых символов Data Matrix приведены в приложении Т.
8.1 Параметры качества символа
8.1.1 Повреждение фиксированного шаблона
Методы измерения и оценки параметра повреждения фиксированного шаблона установлены в приложении М.
Примечание - Согласно ИСО/МЭК 15415 (приложение А) измерения и величины, установленные в приложении М настоящего стандарта, приведены взамен установленным в ИСО/МЭК 15415 (приложение А).
8.1.2 Качество сканирования и полный класс символа
Класс качества сканирования определяют как наименьшую величину из классов отдельных параметров - контраста, модуляции, повреждения фиксированного шаблона, декодирования, осевой неоднородности, неоднородности сетки модулей и неиспользованного исправления ошибок для отдельного изображения символа. Полный класс символа вычисляют как среднеарифметическое значение отдельных классов качества сканирования для нескольких тестовых изображений символа.
8.1.3 Неоднородность сетки
Идеальную сетку модулей рассчитывают с использованием четырех угловых точек реальной полученной сетки для каждой области данных и разделением ее на одинаковые ячейки по обеим осям.
8.1.4 Декодирование
Для получения класса декодирования следует использовать рекомендуемый алгоритм декодирования (раздел 9). Неспособность рекомендуемого алгоритма декодирования успешно декодировать символ оценивают как класс декодирования 0.
8.2 Измерения в процессе контроля
Для проведения необходимых измерений с целью мониторинга и контроля процесса производства символов Data Matrix используют средства и методы, описанные в приложении R. Указанные методы не позволяют точно оценить качество печати нанесенных символов (дополнительные рекомендации приведены выше в этом пункте, а также в приложении М), но использование каждого метода по отдельности и всех вместе может быть рекомендовано для производства надлежащих символов в процессе их печати.
9 Рекомендуемый алгоритм декодирования для символики Data Matrix
_______________
а) определяют значения параметров размеров и формируют цифровое изображение:
4) формируют черно-белое изображение, используя порог, определенный по методике, установленной в ИСО/МЭК 15415;
б)* осуществляют поиск горизонтальной и вертикальной линий сканирования для двух внешних L-образных границ Data Matrix:
1) продлевают горизонтальную линию сканирования по обе стороны от центральной точки изображения и, следуя вдоль этой линии, находят все точки перехода черное/белое и белое/черное. Для каждой точки перехода, найденной на линии сканирования и приведенной к границе пикселя (называемой далее точкой старта), производят следующее:
I) проводят линию А, соединяющую конечные точки вертикальной границы перехода;
V) вычисляют новую откорректированную линию А1, которая является "наиболее приближенной" линией для границы перехода, определенной на двух предыдущих этапах. "Наиболее приближенную" линию вычисляют с использованием алгоритма линейной регрессии (используя конечные точки для выбора зависимой оси, то есть если они ближе к горизонтальной оси, зависимая ось - ось х) для каждой точки. На "наиболее приближенной" прямой линии отмечают отрезок, ограниченный точками p1 и р2, которые являются ближайшими к найденным выше конечным точкам границы перехода;
VI) сохраняют две конечные точки отрезка линии А1 - p1 и р2. Также сохраняют значение цвета левой стороны края границы перехода, видимое при движении от p1 к р2;
vi) повторяют вышеуказанный процесс для следующей точки перехода на линии сканирования, начиная с этапа, указанного в перечислении i), до достижения края изображения;
2) проводят линию сканирования вертикально в обоих направлениях от центральной точки изображения. Находят отрезки линий с использованием той же логической процедуры, что и на этапе, указанном в пункте 1), одновременно следуя от каждой границы перехода символа влево, а затем вправо;
3) среди сохраненных отрезков линий А1 осуществляют поиск пар отрезков, удовлетворяющих следующим четырем условиям:
ii) два вышеуказанных отрезка должны быть параллельными с отклонением не более 5°;
iii) два вышеуказанных отрезка должны быть одного цвета, если отрезки имеют одинаковое направление от p1 к р2, или противоположного цвета, если направления этих отрезков противоположны;
4) для каждой пары линий, соответствующих требованиям этапа, указанного в перечислении 3), заменяют эту пару отрезков линий на один удлиненный отрезок линии А1 путем выбора "наиболее приближенной" линии по четырем конечным точкам пары рассматриваемых коротких отрезков линий. Также запоминают значение цвета левой стороны границы перехода новой удлиненной линии, рассматриваемой от конечной точки p1 до конечной точки р2;
5) повторяют этапы, указанные в перечислениях 3) и 4), до тех пор, пока возможно комбинировать пары линии А1;
7) находят среди полученных пар предполагаемых L-образных сторон две линии, которые должны соответствовать следующим трем критериям:
ii) эти две линии должны быть взаимно перпендикулярны с погрешностью до 5°;
iii) внутренняя сторона угла, образованного этими линиями, должна иметь один и тот же цвет.
8) для каждой пары отрезков - предполагаемых L-образных границ, найденных на этапе, указанном в перечислении 7), формируют предполагаемую L-образную структуру путем продления отрезков до точки их пересечения;
9) если предполагаемая L-образная структура была сформирована из отрезков линий белого цвета внутри угла L-образной структуры, формируют инвертированное по цвету изображение для декодирования. Предпринимают попытки декодировать символ, начиная с нормального или инвертированного изображения, выбирая в качестве начального этап, указанный в перечислении d), используя каждую предполагаемую L-образную структуру, определенную на этапе, указанном в перечислении 8), как L-образный шаблон поиска. Если декодирование не удалось выполнить, переходят к этапу, указанному в перечислении с);
Для получения доступа к полной версии без ограничений вы можете выбрать подходящий тариф или активировать демо-доступ.