DOI 10.17586/0021-3454-2025-68-6-494-499
УДК 004.852
МЕТОДЫ ПРЕДОБРАБОТКИ ОЦИФРОВАННЫХ РУКОПИСНЫХ ДОКУМЕНТОВ
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И. Ульянова (Ленина), Санкт-Петербург, 197376, Российская Федерация; Российский государственный гидрометеорологический университет, Санкт-Петербург, 195196, Российская Федерация; профессор; заведующий кафедрой
Шихотов А. А.
Санкт-Петербургский государственный университет аэрокосмического приборостроения, кафедра прикладной информатики ;
Ссылка для цитирования : Татарникова Т. М., Шихотов А. А. Методы предобработки оцифрованных рукописных документов // Изв. вузов. Приборостроение. 2025. Т. 68, № 6. С. 494–499. DOI: 10.17586/0021-3454-2 025-68-6-494-499.
Аннотация. Решается задача автоматизации анализа рукописных документов. Показано, что при решении подобных задач используются искусственные нейронные сети, способные к распознаванию образов после обучения на исходном наборе данных. При этом качество распознавания новых образов большей частью зависит от этапа предобработки оцифрованных рукописных документов. Рассмотрена частная задача предобработки — удаление линий клетки с изображения листа тетради. Проанализированы четыре метода фильтрации изображения с использованием библиотеки OpenCV языка Python. Выполнено обучение нейронной сети сверточной архитектуры распознаванию рукописных символов. Продемонстрирована работа обученной нейронной сети на документах, предобработанных разными алгоритмами.
Аннотация. Решается задача автоматизации анализа рукописных документов. Показано, что при решении подобных задач используются искусственные нейронные сети, способные к распознаванию образов после обучения на исходном наборе данных. При этом качество распознавания новых образов большей частью зависит от этапа предобработки оцифрованных рукописных документов. Рассмотрена частная задача предобработки — удаление линий клетки с изображения листа тетради. Проанализированы четыре метода фильтрации изображения с использованием библиотеки OpenCV языка Python. Выполнено обучение нейронной сети сверточной архитектуры распознаванию рукописных символов. Продемонстрирована работа обученной нейронной сети на документах, предобработанных разными алгоритмами.
Ключевые слова: распознавание образов, рукописный документ, нейронные сети, шум, предобработка, качество распознавания
Список литературы:
Список литературы:
- Кривошеев А. В. Сопряжение мультиагентных и нейросетевых технологий в программной системе распозна- вания образов для роботизированного документооборота // Вестн. Рязанского государственного радиотехни- ческого университета. 2024. № 87. С. 54–61. DOI: 10.21667/1995-4565-2024-87-54-61.
- Ferrer M. A., Diaz M., Carmona-Duarte C., Morales A. A behavioral handwriting model for static and dynamic signature synthesis // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2017. Vol. 39, N 6. P. 1041–1053.
- Калько А. И. Система идентификации рукописных текстов как объект защиты и обработки массового объема документов // 9-я Междунар. науч.-практ. Конф. „BIG DATA and Advanced Analytics. BIG DATA и анализ вы- сокого уровня“. Минск, Республика Беларусь, 17–18 мая 2023 года. С. 276–284.
- Кучуганов А. В., Лапинская Г. В. Распознавание рукописных текстов. Ижевск: Мир, 2006. 514 с.
- Шапиро Л., Стокман Дж. Компьютерное зрение. M.: БИНОМ. Лаборатория знаний, 2015. 763 с.
- Бреусова Е. И. К проблеме распознавания рукописного текста // Вестн. Челябинского государственного педа- гогического университета. 2017. № 1. С. 88–92.
- Ахунджанов У. Ю., Старовойтов В. В. Предварительная обработка изображений рукописных подписей для последующего распознавани // Системный анализ. 2022. № 2. С. 4–9. DOI: 10.21122/2309-4923-2022-2-4-9.
- OpenCV library. O’Reilly Media Inc, 2008. 6 p.
- Горитов А. Н. Предварительная обработка изображений в системах технического зрения // Доклады ТУСУР. 2018. Т. 21, № 4-1. С. 53–58.
- Семенов А. Н. Обнаружение радиолокационных целей с помощью преобразования Хафа // Наука и Образование: научное издание МГТУ им. Н.Э. Баумана. 2014. № 12. С. 619–632. DOI: 10.7463/1214.0738733.
- Wu B., Wan A., Yue X. and Keutzer K. SqueezeSeg: Convolutional Neural Nets with Recurrent CRF for Real-Time Road-Object Segmentation from 3D LiDAR Point Cloud // 2018 IEEE International Conference on Robotics and Automation (ICRA). Brisbane, QLD, Australia, 2018. P. 1887–1893. DOI: 10.1109/ICRA.2018.8462926.
- Скрыпников А. В., Денисенко В. В., Хитров Е. Г., Евтеева К. С., Савченко И. И. Распознавание рукописного текста с использованием нейронных сетей // Современные наукоемкие технологии. 2021. № 6-1. С. 91–95. DOI: https://doi.org/10.17513/snt.38703.
- Makridakis S., Spiliotis E., Assimakopoulos V. Statistical and Machine Learning forecasting methods: Concerns and ways forward // PloS one. 2018. Vol. 13. P. 1–20.
- Taherdoost H., Sahibuddin S., Jalaliyoon N. Exploratory Factor Analysis; Concepts and Theory // Advances in applied and pure mathematics. 2022. Vol. 27. P. 375–382.
- He K., Zhang X., Ren S. and Sun J. Deep residual learning for image recognition // 2016 IEEE Conf. on Computer Vision and Pattern Recognition (CVPR). 27–30 June 2016. P. 770–778. DOI: 10.1109/CVPR33180.2016.
- Татарникова Т. М., Бимбетов Ф., Богданов П. Ю. Выявление аномалий сетевого трафика методом глубокого обучения // Изв. СПбГЭТУ ЛЭТИ. 2021. № 4. С. 36–41.
- Suprun A., Tatarnikova T., Sikarev I., Shmeleva A. Detection of malicious program for the android platform by deep training // Lecture Notes in Networks and Systems. 2022. Vol. 387. P. 31–38. DOI: 10.1007/978-3-030-93872-7_3.