Исследователи Сибирского федерального университета (СФУ) и Санкт-Петербургского государственного электротехнического университета «ЛЭТИ», подведомственных Минобрнауки России, разработали новую сверточную нейросеть (CNN). Она способна распознавать на изображении рукописные буквы русского алфавита с точностью до 99%.
Распознавание текста, написанного кириллицей от руки, воспроизводится с высокой точностью вне зависимости от типа почерка. Под нейросеть также было создано специальное приложение, защищенное от утечек и не требующее подключения к интернету, что само по себе надежно в плане конфиденциальности и безопасности пользователя.
Нейросеть обучали посредством предварительной обработки данных хранилища CoMNIST, содержащего рукописные начертания букв на латинице и кириллице. Набор данных для анализа включал 13299 фотографий с прописными, печатными и курсивными буквами. Для программирования ученые выбрали язык Python и интерактивную среду разработки Jupyter.
Как сообщается на сайте Минобрнауки, исследователи сначала построили новый набор данных и пометили изображения для 33 букв российского алфавита. После они создали архитектуру CNN для обнаружения этих букв и сравнили результаты с уже существующими мощными моделями CNN. Напоследок уже было представлено полное описание сверточной нейросети и исходного кода для дальнейшего их воспроизведения другими исследователями.
В будущем эксперты планируют обучение нейросети «чтению» слов и предложений целиком, а также возможности различать стили письма.
Комментарии