ОБЗОР КОДИРОВОК ГРЕЧЕСКИХ ШРИФТОВ
Под кодировкой шрифта в дальнейшем понимается система соответствий
между кодами символов и их начертаниями (глифами). Традиционная
кодовая таблица содержит 16x16=256 ячеек, из которых реально могут
использоваться лишь 222, поэтому задача составителя кодировки сводилась к
отбору необходимых символов и их размещению в этом пространстве. Для
языков, использующих, подобно греческому, большое количество диакритических
знаков, возможны два основных принципа составления кодировки:
на основе комбинируемых диакритических знаков (combining
diacritics) и на основе предопределенных комбинаций (precomposed
characters).
Кодировки на основе комбинируемых
диакритических знаков основаны на следующем принципе: каждый
диакритический знак оформляется как отдельный символ, смещенный за левый
или правый край отведенного для него пространства. Самому этому
пространству приписывается нулевая или ничтожно малая толщина. При печати
такой символ перекрывается с предыдущим или последующим символом. Таким
образом можно, например, разместить акцент над или под буквой.
Принципиальные достоинства этого метода:
- Простота изготовления шрифта, т. к. количество символов, подлежащих
включению в кодовую таблицу, сводится до минимума. Именно по этой
причине на данном принципе основано большинство греческих шрифтов
кустарного происхождения.
- Простота ввода текста, т. к. небольшое количество символов можно
разместить так, чтобы все они были доступны с английской клавиатуры. По
этой причине шрифты такого рода пользуются наибольшей популярностью
среди начинающих.
- При условии соблюдения предыдущего принципа шрифт приобретает большую
устойчивость к преобразованиям текста между форматами разных программ и
переносу с платформы на платформу, поскольку символы, входящие в
стандартный американский набор, при всех перекодировках остаются на своих
местах. Последнее достоинство особенно существенно ввиду широкого
распространения юникодовых приложений (Microsoft Word 97/2000/XP), из-за
которого ординарные документы иногда перекодируются из Unicode и обратно по нескольку раз в день.
Если же требуется типографское качество оформления текста, то
обнаруживаются и недостатки такого рода шрифтов:
- Трудно добиться того, чтобы диакритические знаки подходили к разным по
ширине буквам. В некоторые шрифты для этой цели включено два или более
набора диакритических знаков, из которых первые должны сидеть немного
ближе, а другие немного дальше. На самом деле, таких наборов нужно как
минимум три (под йоту, омегу и все остальные буквы), а желательно еще один
— под альфу. При этом сложность кодировки возрастает до такой степени, что
теряются все ее исходные достоинства. В действительности данная проблема
решаема: расстояние между диакритическими знаками и буквами может
настраиваться с помощью
кернинга, как это делается в качественных
церковнославянских шрифтах. Однако реализации такого подхода
применительно к греческим шрифтам практически отсутствуют. Единственное
исключение — шрифт SGreek, но это
исключение принадлежит именно к числу подтверждающих правило.
- Другой недостаток состоит в том, что последовательность ввода
диакритических знаков в некоторых случаях может быть различной (например,
если нужно проставить подписную йоту и ударение/придыхание).
Неоднозначность еще более возрастает, если один и тот же диакритический
знак представлен в шрифте несколькими вариантами. В результате то же самое
слово может быть набрано различными способами, что создаст проблемы,
например, с его поиском.
- Принципиально неустранимый недостаток заключается в невозможности
межбуквенного кернинга. В самом деле,
бессмысленно настраивать расстояние между двумя буквами, если вклинившийся
между ними диакритический знак (хотя бы и в нулевую толщину) в состоянии
разрушить весь замысел.
По этой причине профессиональные разработчики шрифтов обычно
придерживаются принципа предопределенных
комбинаций, когда каждое сочетание буквы с тем или иным диакритическим
знаком оформляется как особый символ. Для того, чтобы пользоваться таким
шрифтом, нужно иметь специальную утилиту для
клавиатуры, которая могла бы обеспечить ввод акцентированных символов
при помощи более или менее удобных сочетаний клавиш. К кодировке шрифта,
построенной по принципу предопределенных комбинаций, можно предъявить
следующие требования:
Кодировка должна быть логичной. Это значит, что
однородные символы (например, комбинации какой-то одной буквы с различными
диакритическими знаками) должны располагаться рядом друг с другом и в
определенном порядке, так, чтобы не создавать дополнительных затруднений
человеку, ищущему нужное сочетание в таблице символов или разрабатывающему
под заданный шрифт раскладку клавиатуры. Если какой-то символ имеет
строчное и заглавное начертания, их нужно размещать так, чтобы обеспечить
при необходимости корректную смену регистра.
Кодировка должна обладать полнотой. Представление о
полноте у разных разработчиков может быть разным. Доступных 222 ячеек
достаточно для основного набора акцентированных символов, употребительных
в греческой письменности (в отличие, например, от церковнославянского
языка, для которого создать шрифт, целиком построенный на предопределенных
комбинациях, невозможно). Однако остаются дополнительные символы,
потребность в которых зависит от конкретных исследовательских задач:
- Числовые символы и вышедшие из употребления буквы. Каждый из этих
символов может быть представлен в вариантах для верхнего и нижнего
регистра.
- Аттические числительные.
- Комбинации iota/ypsilon с diaeresis circumflexus. Встречаются в
текстах, но практически никогда не включаются в шрифты.
- Комбинации epsilon/omicron с облеченным ударением, нужные для
аттических надписей.
- Комбинации со знаками долготы/краткости. Включение всех подобных
комбинаций (т. е. и тех случаев, когда долгота/краткость сочетается
с другими надстрочными знаками) способно увеличить количество
необходимых символов вдвое-втрое.
- Дополнительные знаки препинания, т. е. в первую очередь парные
кавычки и тире.
- Альтернативные формы букв. Из них по-настоящему важны альтернативная
beta, сходная по форме с русским курсивным в (curled beta),
которая во французских изданиях и в самой Греции часто используется в
середине слова, и полулунная (lunate) сигма, употребительная в
англо-американской типографской традиции.
- Комбинации заглавных букв с iota subscriptum. Шокируют некоторых
классицистов (см. образец), однако широко употребляются в греческих
изданиях (в первую очередь в богослужебных книгах).
- Перевернутые iota/ypsilon circumflexus. Употреблялись в начале XX века
в некоторых печатных изданиях на димотике.
Подробное описание этих и других символов и связанных с ними
типографских традиций см. в работе Я. Хараламбуса
«From Unicode
to Typography, a Case Study: The Greek Script».
Таким образом, выбор символов для включения в кодировку шрифта является
непростой задачей. Удачно составленная кодировка является своего рода
произведением искусства, способным надолго пережить конкретную
программу или шрифт, с которыми оно было связано первоначально.
На этих страницах мы предлагаем краткий обзор наиболее известных
кодировок греческих шрифтов, которые характеризуются исходя из названных
принципов.
Частный случай кодировки на основе предопределенных комбинаций
представляет собой греческая часть международной кодовой таблицы
Unicode, которая используется в Windows NT/2000/XP и
Microsoft Word 97/2000/XP. Ей посвящена отдельная
страница.