Новая система оптического распознавания текста EasyOCR

8 июля 2020 года

Wikinews-logo-ru.svg

Проектом EasyOCR развивается новая система оптического распознавания текста, поддерживающая более 40 языков, включая английский, немецкий, французский, японский, китайский, корейский, узбекский, азербайджанский и литовский. Языки на основе кириллицы пока не поддерживаются, но их добавление в списке планов. Код написан на языке Python c использованием фреймворка PyTorch и распространяется под лицензией Apache 2.0. Для загрузки предоставляются готовые модели для языков на основе латинского алфавита и иероглифов.

Для определения и распознавания текста на изображении применяются методы машинного обучения. Для определения текста используется алгоритм машинного обучения CRAFT (Character-Region Awareness For Text) в реализации для PyTorch, способный выделять текст на произвольных объектах, включая этикетки, информационные таблички и дорожные знаки. Для распознавания последовательностей символов применяется свёрточно-рекуррентная нейронная сеть CRNN (Convolutional Recurrent Neural Network, комбинация DCNN и RNN) и алгоритм CTC BeamSearch CTC BeamSearch (Connectionist Temporal Classification) для декодирования выходных данных нейронной сети в текстовое представление.

 

ИсточникиПравить

Эта статья содержит материалы из статьи «Новая система оптического распознавания текста EasyOCR», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
Эта статья загружена автоматически ботом NewsBots и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.
 

Комментарии:Новая система оптического распознавания текста EasyOCR