Автоматизация слогоделения и переноса слов в церковнославянских текстах

Автор: А.А. Андреев, М.П. Крутиков

Журнал: Труды и переводы @proceedings-and-translations

Рубрика: Кафедра древних языков

Статья в выпуске: 1, 2017 года.

Бесплатный доступ

Решение проблемы автоматизации слогоделения и переноса слов (hyphenation) в системе TeX было впервые предложено для английского языка в 1983 г. Ф. Льянгом. Однако до сих пор этот метод не применялся к церковнославянским текстам в кодировке Юникод. Тем не менее проблема автоматизации переноса слов является актуальной при верстке церковнославянских текстов, как в научных изданиях, так и в богослужебных книгах. В данной статье формулируются правила переноса слов для современного церковнославянского языка и предлагается автоматизированное решение, основанное на методе Льянга. Авторы описывают процедуру генерирования шаблонов переноса (hyphenation patterns) с использованием новой программы, разработанной авторами, и предлагают методы и критерии оценки их эффективности. Полученные шаблоны скомпонованы в пакет, позволяющий автоматически оформлять перенос слов как в си- стеме компьютерной типографики TeX (и производных программах), так и в текстовых редакторах и других программах верстки текста.

Еще

Типографика, морфология, слогоделение, компьютерные алгоритмы, Юникод, TeX, LaTeX, Алгоритм Кнута-Льянга, PATGEN

Короткий адрес: https://sciup.org/140290799

IDR: 140290799

Список литературы Автоматизация слогоделения и переноса слов в церковнославянских текстах

  • Грот Я. К. Русское правописание. СПб.: Тип. Императорской Академии наук, 1902. 167 с.
  • Andreev A., Shardt Y., Simmons N. Unicode Technical Note 41: Church Slavonic Typography in Unicode. 2015. URL: http://www.unicode.org/notes/tn41/.
  • Davis M., Whistler K. Unicode Standard Annex 15: Unicode Normalization Forms / Unicode Consortium. 2016. URL: http://www.unicode.org/reports/tr15/.
  • Ferguson M. J. Report on Multilingual Activities // TUGboat. 1990. Т. 11, No 4. С. 514–516.
  • Haralambous Y. A small tutorial on the multilingual features of PatGen2. 1993.
  • Haralambous Y. Hyphenation patterns for Ancient Greek and Latin // TUGboat. 1992. Т. 13, № 4. С. 459–467.
  • Knuth D. E. TeX and METAFONT: new directions in typesetting. Digital Press, 1979.
  • Liang F. M. Word Hy-phen-a-tion by Com-put-er: дис. ... док. философии / Stanford University. 1983.
  • Sojka P., Antoš D. Context sensitive pattern based segmentation: a Thai challenge // Proceedings of EACL 2003 Workshop on Computational Linguistics for South Asian Languages. 2003. С. 65–72.
Статья научная