ГРЕЧЕСКИЙ ДИАПАЗОН КОДОВОЙ ТАБЛИЦЫ UNICODE
Unicode представляет собой международный стандарт представления
многоязычного текста, который требует, чтобы каждый символ кодировался
двумя байтами. Это дает кодовую таблицу размером в 256x256=65536 ячеек,
чего достаточно для размещения почти всех символов, используемых в
большинстве известных видов письменности. Назначение большинства этих
ячеек жестко определяется спецификацией Unicode, хотя предусмотрены и так
называемые области личных символов (private use characters), которые
разработчик шрифта может заполнять по своему усмотрению. Для обозначения
символов Unicode принято использовать шестнадцатеричные номера от
0000 до FFFF. Для греческих символов отведены две области Unicode:
- Греческие и коптские символы (0370—03FF).
Включает стандартный монотонический набор, присутствующий в греческой
кодовой странице 1253, и некоторые дополнительные символы.
- Греческий расширенный (1F00—1FFF). Включает все акцентированные
символы, необходимые для классического языка. С добавлением этой области
Unicode стал первым международно признанным стандартом на политоническую
греческую кодировку.
Таблицы всех разделов Unicode с комментариями к каждому символу можно
найти на
официальном сайте Unicode Consortium, где они представлены в формате
PDF. Справляться с этими таблицами время от времени приходится не только
производителям шрифтов, но и всякому пользователю, желающему грамотно
оформлять свои документы.
Политонические греческие символы Unicode не имеют соответствий в
стандартных кодовых страницах семейств windows-125* и ISO-8859 и потому
могут использоваться только в приложениях, поддерживающих Unicode. Однако
количество и популярность таких приложений в настоящее время стремительно
возрастают. В частности, к этой категории относятся:
- Microsoft Word 97/2000/XP и другие приложения, входящие в комплект
Microsoft Office;
- Свободно распространяемый кроссплатформенный офисный комплект
OpenOffice.org,
представляющий достойную альтернативу для продукции Microsoft;
- Издательская система Adobe InDesign;
- Последние версии текстовых процессоров KWord и AbiWord для операционных
систем семейства Unix;
- Большое количество разнообразных редакторов неформатированного
текста.
Таким образом, использование Unicode в настоящее время является вполне
целесообразным, тем более, что, согласно замечанию Дж. Рустена (ответственного за программу GreekKeys), «ни один другой
греческий шрифт в Microsoft Word 97 не работает нормально». Кроме
того, Unicode содержит дополнительные символы, отсутствующие в других
распространенных кодировках греческих шрифтов. Чтобы иметь возможность
набирать греческий текст в формате Unicode, а в случае необходимости и
преобразовать его в другую кодировку, мы рекомендуем использовать
разработанный нами пакет СОЛУНЬ для Microsoft
Word 97/2000/XP или OpenOffice.org.
Обзор греческих шрифтов в формате Unicode можно найти
здесь, а также на нашей странице ссылок.
Далее следует ряд замечаний ко греческим разделам кодовой таблицы
Unicode:
- Каждый символ Unicode помимо номера имеет уникальное имя, содержащее
более или менее подробную характеристику его назначения. Для греческих
символов используются греческие имена в современном
произношении. Например, символ 1F84 (alpha iota subscriptum lenis
acutus) называется «GREEK SMALL LETTER ALPHA WITH PSILI AND OXIA AND
YPOGEGRAMMENI». Таким подходом подчеркивается изначальная ориентация
стандарта не столько на нужды классицистов, сколько на собственно
греческие типографские традиции.
- Целесообразность включения в Unicode символа E037 (GREEK QUESTION
MARK) под вопросом. Большинство авторитетов предлагает использовать вместо
него стандартную точку с запятой, с которой этот символ, естественно,
совпадает по начертанию.
- Набор «Греческие и коптские символы» включает ряд
альтернативных форм букв. Например, спецификация Unicode изображает
«закрытую» тету в позиции, отведенной для этой буквы (символ
03B8). В то же время присутствует и открытая форма, имеющая код 03D1 и
название GREEK THETA SYMBOL. Некритическое восприятие спецификации
разработчиками шрифтов приводит последних к убеждению, что в тексте должна
употребляться только форма q, в то время как
J предназначена для использования в качестве
технического символа. В действительности выбор начертания должен всецело
определяться дизайном шрифта. По этой причине включение в Unicode такого
рода альтернативных форм представляется ошибочным. По-настоящему нужными
следует считать только символ 03D0 (серединная beta) и 03F2 (полулунная
sigma).
- Архаические и числовые символы (digamma, stigma, qoppa, sampi) имеют
варианты для верхнего и нижнего регистра. В последней версии стандарта
добавлен (также в заглавном и строчном варианте) символ Qoppa Archaic,
потребность в котором объясняется тем, что типографская традиция требует
различать числовую (зигзагообразную) и текстовую (употребительную, например,
в публикациях эпиграфических памятников) формы этой буквы.
- Коптские символы, входящие в стандарт, в настоящее время бесполезны,
так как должны использоваться в сочетании с унциальными греческими
буквами. Теоретически ничто не мешает сделать унциальный шрифт Unicode,
который мог бы включать символы латинского, греческого и славянского
алфавитов; практически же идея создания подобного шрифта еще никому не
приходила в голову.
- Набор «Греческие и коптские символы» включает символ tonos
и комбинации с ним; набор «Греческий расширенный» включает
символ oxia (острое ударение) и акцентированные комбинации с ним. Обычно
оба символа совпадают по начертанию, однако tonos может иметь вертикальную
форму. Согласно утверждению многих специалистов, вертикальная форма
ударения (даже при монотонической орфографии) противоречит греческим
типографским традициям, и, следовательно, проведенное в Unicode
разграничение между этими двумя символами является ошибочным. Так или
иначе, при существующем положении дел очевидно, что в политонических
текстах должны употребляться только комбинации с символом oxia.
- В наборе «Греческий расширенный» присутствуют сочетания
букв alpha, iota, ypsilon со знаками долготы/краткости, но нет сочетаний,
в которых кроме этих знаков присутствовали бы придыхания и ударения.
Очевидно, данный недостаток не будет исправлен, так как в Unicode уже нет
достаточного количества свободных ячеек.
- Набор «Греческий расширенный» включает сочетания заглавных
букв с надстрочными знаками. Назначение данных символов состоит в
облегчении перевода строчных букв в заглавные, хотя такая возможность для
греческих акцентированных символов пока не реализована ни в одной
программе. С появлением этих символов многие разработчики шрифтов
перестали делать кернинг между надстрочными знаками и заглавными буквами,
полагая данные сочетания более не нужными, так что использовать вместо них
составные символы приходится волей-неволей. Типичный недостаток их
реализации в существующих шрифтах: диакритика ставится слишком близко к
букве, иногда практически вплотную.
- Имеются также сочетания заглавных букв с iota adscriptum, назначение
которых то же, что и в предыдущем случае. Однако более удачными
представляются те шрифты, в которых йота при заглавных буквах оформлена
как подписная. Если же пользователь не желает оформлять йоту при заглавных
буквах как подписную, то всегда можно набрать ее отдельно.