Разработка методов автоматической структуризации и дефрагментации изображений текстовых документов

Автор: Горшков Данила Андреевич, Ершов Николай Михайлович

Журнал: Сетевое научное издание «Системный анализ в науке и образовании» @journal-sanse

Статья в выпуске: 2, 2021 года.

Бесплатный доступ

Работа посвящена исследованиям способов сегментации изображений и методов автоматического распознавания стилей форматирования заданного текстового блока. Целью работы является разработка методов автоматической структуризации и дефрагментации изображений текстовых документов, т.е. нужно произвести сегментацию текстового фрагмента на изображении с дальнейшей программной реализацией автоматической классификации текстовых фрагментов. В работе предложен алгоритм сегментации изображений, основанный на пороговой сегментации. Такой алгоритм позволяет достичь достаточно точной сегментации изображений. Проводится обзор разработанных методов распознавания стилей, описывается актуальность проводимого исследования. Также проводится численное исследование методов. Описывается программная реализация предложенных алгоритмов и методов, с использованием языка программирования Python, демонстрируются примеры работы программы на изображениях с текстовыми блоками. Были проведены тесты разработанных методов на двух выборках текстовых изображений, для этого были сгенерированы тестовые изображений с помощью языка программирования Python, библиотеки ImageMagic и системы компьютерной верстки Latex. Проведенное тестирование показало перспективность предложенных подходов и методов к структуризации и классификации текстовых блоков.

Еще

Сегментация текстовых блоков, распознавание стилей форматирования

Короткий адрес: https://sciup.org/14123334

IDR: 14123334

Список литературы Разработка методов автоматической структуризации и дефрагментации изображений текстовых документов

  • Santos R., Clemente G. S., Ing Ren T., Calvalcanti G. Text Line Segmentation Based on Morphology and Histogram Projection // Document Analysis and Recognition, 10th International Conference on, 2009. Pp. 651-655. DOI: 10.1109/ICDAR.2009.183.
  • Likforman-Sulem L., Zahour A., Taconet B. Text line segmentation of historical documents: a survey // International Journal on Document Analysis and Recognition. 2007. № 9. Pp. 123-138. DOI:10.1007/s10032-006-0023-z.
  • Shapiro L. G., Stockman G. C. Computer Vision. New Jersey: Prentice-Hal, 2001. 580 pp. ISBN 0-13-030796-3.
  • Sagar B. M., Shobha G. , Ramakhanth Kumar P. Converting printed Kannada text image file to machine editable format using Database // International Journal of Computers. 2008. Vol. 2. Pp. 173–175.
  • Srihari S. N., Govindaraju V., Shekhawat A. Interpretation of Handwritten Addresses in US Mailstream // Proceedings of 2nd International Conference on Document Analysis and Recognition (ICDAR '93). 1993. Pp. 291–294. DOI: 10.1109/ICDAR.1993.395729.
  • Maloo M., Kale K. V. Gujarati Script Recognition: A Review // International Journal of Computer Sci-ence Issues.2011. Vol. 8, Issue 4, № 1. Pp. 480–489.
  • Patil S. B. Neural Network based bilingual OCR system: experiment with English and Kannada bilingual document // International Journal of Computer Applications. 2011. Vol. 13, № 8. Pp. 6–14.
  • Thungamani M. and Ramakhanth Kumar P. A Survey of Methods and Strategies in Handwritten Kannada Character Segmentation // International Journal of Science Research. 2012. Vol 01, Issue 01. Pp. 18–23.
  • Das M. S., Reddy C. R. K., Govardhan A., Saikrishna G. Segmentation of Overlapping Text lines, Char-acters in printed Telugu text document images // International Journal of Engineering Science and Tech-nology. 2010. Vol. 2(11). Pp. 6606–6610.
  • Arica N.,Yarman-Vural Fatos T. An Overview of Character Recognition Focused on Off-Line Handwrit-ing // IEEE Transactions. Systems, Man, and Cybernetics. Part C: Applications and Reviews. 2001. Vol. 31. Pp. 216–233. DOI: 10.1109/5326.941845.
  • Marinai S., Nesi P. Projection Based Segmentation of Musical Sheets //Document Analysis and Recog-nition. 1999. Pp. 515–518. DOI: 10.1109/ICDAR.1999.791838.
  • Junga K., Kimb K. I., Jain A. K. Text information extraction in images and video: A survey// Pattern Recognition. 2004. Vol. 37. Pp. 977–997. DOI: 10.1016/j.patcog.2003.10.012.
  • Pham D. L.; Xu Ch. Prince J. Current Methods in Medical Image Segmentation // Annual Review of Biomedical Engineering. 2000. Vol. 2. Pp. 315–337. DOI: 10.1146/annurev.bioeng.2.1.315.
  • Lew M. S., Sebe N., Djeraba C., Jain R. Content-based Multimedia Information Retrieval: State of the Art and Challenges // ACM Transactions on Multimedia Computing, Communications, and Applications. 2006. Vol. 2, № 1. Pp. 1–19. DOI:10.1145/1126004.1126005.
  • Naramala V. R., Srikrishna A., Bhogapathi R., Babu G. An efficient feature extraction and classification of handwritten digits using neural networks // International Journal of Computer Science, Engineering and Applications. 2011. Vol.1, № .5. Pp. 47–56. DOI: 10.5121/ijcsea.2011.1505.
  • Xiaoyan Z., Yifan S. New Algorithm for Handwritten Character Recognition. Beijing, China.
  • Aboeleneen Z. A, Abdel Azim G. An Improved Image Segmentation Algorithm Based on MET Method[J] // International Journal of Computer Science Issues. 2012. Vol. 9, Issue 5, № 3. Pp. 346–351.
  • Xu C., Huang F., Mao Z. An improved two-dimensional Otsu thresholding segmentation method[J] // Application of Electronic Technique, 2016.
  • Zhao H, Wang Q, Wu W, Yuan N. An Improved Method Research of SAR Images Thresholding Seg-mentation // Lecture Notes in Electrical Engineering, 2014. Vol. 238. Pp. 1151–1157. DOI: 10.1007/978-1-4614-4981-2-125.
  • Wang Y. Q., Zhuang L. L., Shi C. X. Construction Research on Multi-Threshold Segmentation Based on Improved Otsu Threshold Method // Advanced Materials Research. 2014. Vol.1046. Pp. 425–428. DOI: 10.4028/www.scientific.net/AMR.1046.425.
Еще
Статья научная