Инициатива по созданию полнофункциональной свободной системы распознавания речи

14 октября 2013 года

Представлен проект "Open Speech Initiative", в рамках которого планируется собрать группу разработчиков, заинтересованных в развитии полнофункциональной и качественной свободной системы распознавания речи. Инициатива будет развиваться под эгидой проекта KDE на сайте speech.kde.org(недоступная ссылка).

Целью Open Speech Initiative является объединение усилий разрозненных исследователей и разработчиков в направлении создания универсальной системы распознавания речи, подходящей для разных областей применения, обладающей высокой точностью распознавания и большим словарём. Для достижение данной цели требуется объединение в едином сообществе различных категорий энтузиастов, от разработчиков ПО до лингвистов и специалистов по цифровой обработке сигналов.

Open Speech Initiative будет курировать работу сообщества, координировать развитие и решать организационные вопросы. В настоящее время основная работа сосредоточена на низкоуровневых компонентах платформы и подготовке инфраструктуры и автоматизированных систем для оптимизации процесса построения более качественных акустических моделей. В планах на будущее упомянуто создание пользовательского ПО, которое сможет выступать в роли диктофона, печатающего текст под диктовку, или автомачески формировать субтитры для видео.

В настоящее время к инициативе уже подключились разработчики платформы Simon, позволяющей организовать управление десктопом при помощи голосовых команд без необходимости использования клавиатуры и мыши, а также сооснователь платформы SonicCloud (Архивная копия от 15 апреля 2015 на Wayback Machine). В анонсе упоминается создание на базе Simon рабочего прототипа приложения с функциями диктофона, пригодного для организации речевого ввода текстовой информации. В настоящее время система уже достаточно успешно позволяет вводить через диктовку небольшие заметки, в том числе распознавая команды для перехода к новому абзацу, вставки знаков пунктуации и спецсимволов.

Источники

править


 
 
Creative Commons
Эта статья содержит материалы из статьи «Инициатива по созданию полнофункциональной свободной системы распознавания речи», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.