The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Индекс форумов
Составление сообщения

Исходное сообщение
"Релиз свободной системы распознавания речи Simon 0.4"
Отправлено opennews, 31-Дек-12 19:20 
После двух лет разработки представлен (http://simon-listens.blogspot.ru/2012/12/simon-040.html) релиз системы распознавания речи Simon 0.4 (http://www.simon-listens.org), позволяющей организовать управление десктопом при помощи голосовых команд, без необходимости использования клавиатуры и мыши. Средства для голосового управления рабочим столом доступы для Windows и окружений на базе X11. Код системы распространяется (http://download.kde.org/stable/simon/0.4.0/) под лицензией GPLv2. Разработка Simon ведётся (https://projects.kde.org/projects/extragear/accessibility/si...) в рамках проекта KDE в составе рабочей группы KDE Accessibility.

В составе проекта  развиваются инструменты для создания голосовых и акустических моделей, распознавания речи и организации управления голосом. Кроме функций управления рабочим столом наработки проекта Simon также используются в таких областях как аутентификация по голосу, голосовые диалоговые системы, организация голосового управления роботами и различными аппаратными устройствами. Ключевой областью применения Simon  является предоставление средств для работы с компьютером людей с ограниченными возможностями. Из интересных проектов, реализованных на базе Simon можно отметить робота ECHORD (http://www.youtube.com/watch?v=PDkEe4G4PX4) для помощи по дому и медиа-центр (http://youtu.be/35tyZntA9j4?t=3m24s) для дома престарелых.

<center><iframe width="640" height="360" src="http://www.youtube.com/embed/7AJ1xDbYMUY?rel=0" frameborder="0" allowfullscreen></iframe></center>


Процесс распознавания в Simon построен на статических алгоритмах - для начала поддержки нового языка достаточно сформировать акустическую и языковую модели, которые в совокупности составляют речевую модель. Если речевая модель уже создана, для начала распознавания команд достаточно пятиминутной тренировки для адаптации системы к особенностям речи конкретного пользователя. Simon может быть легко адаптирован для голосового управления любым приложением, в том числе для организации голосового ввода текста, что, например, позволяет обездвиженным инвалидам просматривать сайты и отправлять электронные сообщения.

<center><iframe width="640" height="360" src="http://www.youtube.com/embed/95l__f--p2k?rel=0" frameborder="0" allowfullscreen></iframe></center>

Ключевые особенности новой версии:


-  Проведена большая работа по улучшению юзабилити. Интерфейс стал более удобен и понятен, как для новичков, так и для давно знакомых с системой пользователей. Проведена реорганизация основного окна управления Simon, наиболее важные опции вынесены на основной базовый экран;
<center><a href="http://1.bp.blogspot.com/-F-InTzfWvY8/UN9tkCLiB7I/AAAAAAAAAO... src="http://www.opennet.ru/opennews/pics_base/0_1356963432.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>

-  Поддержка нового формата (.sbm) для хранения базовых голосовых моделей и средства для интеграции с online-репозиториями базовых моделей GHNS существенно упростили начальную конфигурацию системы голосового управления. Для настройки Simon от установки до получения полностью работающей конфигурации теперь требуется менее пяти минут без проведения каких-либо предварительных действий;


<center><iframe width="640" height="360" src="http://www.youtube.com/embed/ghfMMYNOwXo?rel=0" frameborder="0" allowfullscreen></iframe></center>

-  Обеспечение поддержки CMU SPHINX (http://cmusphinx.sourceforge.net/) в качестве бэкенда для распознавания речи. Поддержка ранее доступных бэкендов для систем HTK и Julius продолжена в полном объёме, тем не менее новые скомпилированные для Simon модели по умолчанию рассчитаны на использование бэкенда SPHINX. Для сборки собственных речевых моделей больше нет необходимости в установке проприетарного пакета HTK. Необходимый для работы Simon бэкенд выбирается автоматически в зависимости от конфигурации текущей системы;

-  Ключевой проблемой открытых систем распознавания речи всегда было отсутствие свободнодоступных высококачественных речевых моделей. Основным источником свободных акустических моделей для различных языков уже много лет является проект Voxforge (http://voxforge.org/home/dev), но качество этих моделей оставляет желать лучшего. Поэтому, кроме возможности работы с уже готовой моделью от проекта Voxforge, в версии Simon 0.4 добавлены средства для участия в улучшении акустических моделей Voxforge. В частности, Simon позволяет отправлять на сервер Voxforge результаты локальной тренировки голосовых моделей.

-  Средства для учёта контекста в процессе распознавания речевых команд. В зависимости от изменения текущей ситуации  для увеличения точности Simon может на лету переконфигурировать себя, включать и выключать дополнительные сценарии, микрофоны и данные, полученные в результате тренировки модели;
-  Новая диалоговая система, позволяющая определять сценарии взаимодействия на языке JavaScript, интегрируемая с движками обработки данных Plasma, поддерживающая задание шаблонов и предоставляющая возможности по озвучиванию текста (text-to-speech);
-  Для пользователей KDE представлен новый плазмоид "Simonoid" для запуска и управления Simon.
<center><a href="http://1.bp.blogspot.com/-p8j5wlpg87c/UN91HsE-xYI/AAAAAAAAAP... src="http://www.opennet.ru/opennews/pics_base/0_1356965330.png" style="border-style: solid; border-color: #e9ead6; border-width: 15px;" title="" border=0></a></center>


URL: http://simon-listens.blogspot.ru/2012/12/simon-040.html
Новость: http://www.opennet.ru/opennews/art.shtml?num=35731

 

Ваше сообщение
Имя*:
EMail:
Для отправки ответов на email укажите знак ! перед адресом, например, !user@host.ru (!! - не показывать email).
Более тонкая настройка отправки ответов производится в профиле зарегистрированного участника форума.
Заголовок*:
Сообщение*:
 
При общении не допускается: неуважительное отношение к собеседнику, хамство, унизительное обращение, ненормативная лексика, переход на личности, агрессивное поведение, обесценивание собеседника, провоцирование флейма голословными и заведомо ложными заявлениями. Не отвечайте на сообщения, явно нарушающие правила - удаляются не только сами нарушения, но и все ответы на них. Лог модерирования.



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру