Google взялась за создание открытой системы распознавания текста

11 апреля 2007 года

Компания Google продолжила открытие технологий связанных с распознаванием текста. В дополнение к ранее открытой системе Tesseract, выпущен новый открытый продукт — OCRopus (лицензия Apache 2.0).

Главная цель OCRopus — выявление и разделение областей текста (и др. объектов) на изображениях. Система модульная, в настоящее время для распознавания текста используется Tesseract, но Google планирует в ближайшие 12 месяцев значительно расширить возможности проекта (например, появится GUI интерфейс и поддержка не только английского языка), релиз намечен на 3 квартал 2008 года.

OCRopus предназначен для автоматизации распознавания отсканированных или снятых на цифровую камеру документов (включая рукописные), программа может использоваться для выявления спама в приложенных к письму изображений.

Источники править


 
 
Creative Commons
Эта статья содержит материалы из статьи «Google взялась за создание открытой системы распознавания текста», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.