В Tesseract OCR 2.0 появился модуль для обучения новым языкам

30 августа 2007 года

В состав новой версии программы распознавания текста Tesseract 2.0, открытой компанией Google около года назад, включены средства для обучения системы работе с новыми языками. Таким образом, время появления OCR с поддержкой русского языка теперь зависит только от того, как скоро найдутся энтузиасты готовые потратить свое время на обучение системы.

В настоящее время обучение системы уже проведено для французского, итальянского, немецкого, испанского и голландского языков.

В заключение, можно отметить выход статьи "Optical Character Recognition With Tesseract OCR On Ubuntu 7.04 (Архивная копия от 21 октября 2020 на Wayback Machine)" с описанием процесса настройки Tesseract 2.0 в Ubuntu Linux, для начинающих.

Источники

править


 
 
Creative Commons
Эта статья содержит материалы из статьи «В Tesseract OCR 2.0 появился модуль для обучения новым языкам», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.