Открытие исходных текстов новой системы распознавания текста

3 сентября 2006 года

В блоге компании Google с опозданием на два месяца анонсировано открытие исходных текстов системы распознавания текста Tesseract.

Система изначально была создана в лаборатории компании Hewlett Packard с 1985 по 1995 год. В 2005 году код был открыт под лицензией Apache и в дальнейшем доведен до версии 1.0 при участии работников компании Google.

В Tesseract OCR имеется только поддержка английского языка, пока нет средств выделения областей текста (например когда текст размещен в несколько колонок).

Источники

править


 
 
Creative Commons
Эта статья содержит материалы из статьи «Открытие исходных текстов новой системы распознавания текста», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.