The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Система распознавания речевых команд в Linux при помощи ПО julius
Для декодирования речевых команд можно использовать открытый проект Julius.


Пользователи Ubuntu могут установить готовые пакеты:

   sudo apt-get install julius julius-voxforge

Так как последний стабильный релиз Julius 4.2.1 некорректно работает с
подсистемой ALSA, при использовании ALSA может потребоваться пересобрать код из cvs-репозитория:

   cvs -z3 -d:pserver:anonymous@cvs.sourceforge.jp:/cvsroot/julius co julius4
   cd julius4
   ./configure --with-mictype=alsa 
   make

Микрофон можно выбрать через переменную окружения ALSADEV, например:

   export ALSADEV="plughw:1,0

Копируем акустические модели voxforge (в случае, если был установлен пакет
julius-voxforge модель уже установлена в /usr/share/julius-voxforge).

Создаём файлы конфигурации по образу
/usr/share/doc/julius-voxforge/examples/julian.jconf.gz. На базе sample.grammar
и sample.voca создаём модели грамматики фраз и команды, после чего выполняем
"mkdfa имя", например:

Файл sample.voca с определением слов Shoulder, Elbow, Wrist, Grip, Light,
on/off,   up/down, open/close:


   % NS_B
   <s>        sil

   % NS_E
   </s>        sil

   % JOINT_N
   WRIST        r ih s t
   ELBOW        eh l b ow
   SHOULDER        sh ow l d er

   % DEV
   LIGHT        l ay t

   % DEV_IN
   ON        aa n
   OFF        ao f

   % MANIP
   GRIP        g r ih p

   % M_ACT
   OPEN        ow p ax n
   CLOSE       k l ow s

   % DIRECTION
   UP        ah p
   DOWN      d aw n

   % ROTATION
   LEFT        l eh f t
   RIGHT       r ay t

Файл sample.grammar с определением сочетания слов (Joint + up | down,
Grip + open | close, Light + on | off, Left | Right):

   S : NS_B SENT NS_E
   SENT: JOINT_N DIRECTION
   SENT: MANIP M_ACT
   SENT: DEV DEV_IN
   SENT: ROTATION
 
NS_E и NS_E определены как начальная и конечная пауза.

Собираем модель:

   mkdfa sample

в результате получаем набор dfa, dict и term файлы.

Для распознания выполняем:

   julius -input mic -C julian.jconf

говорим Left, Right, Shoulder Up и наблюдаем:

   sentence1: <s> RIGHT </s>
   sentence1: <s> LEFT </s>
   sentence1: <s> SHOULDER UP </s>

Пример скрипта command.py для парсинга и запуска внешних программ при
определении тех или иных фраз можно найти в директории /usr/share/doc/julius-voxforge/examples/controlapp


Для распознавания фраз на русском языке можно попробовать использовать
акустическую модель с сайта
http://www.repository.voxforge1.org/downloads/Russian/Trunk/ , но судя по всему
она пока мало пригодна к использованию.
 
Ключи: julius, voice, control / Лицензия: CC-BY
Раздел:    Корень / Пользователю / Запись и обработка звука

Обсуждение [ Линейный режим | Показать все | RSS ]
  • 1.1, Аноним (-), 20:55, 25/06/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В убунте julius довольно древний и бажный, к тому же его уже давно никто не мейнтейнит.
    Лучше ставить с офсайта, глядишь, и хак с алсой не понадобится.
     
  • 1.2, Аноним (2), 20:07, 26/06/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В репах генты как обычно нет ни фига похожего. Всё надо подлкючать искать незнамо где
     
     
  • 2.6, Аноним (-), 09:39, 29/06/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Осиль уже http://gpo.zugaina.org/
     
  • 2.12, mihalych (?), 16:41, 16/07/2012 [^] [^^] [^^^] [ответить]  
  • +/
    emerge eix && eix-remote update
     

  • 1.4, qOp (?), 15:18, 28/06/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Давным давно в далекой гала^w давно жила была звуковая карта AWE32. Так вот в комплекте к ней шла софтина распознающая команды голосом. Предварительно программу надо было научить понимать голос.
     
  • 1.5, анонимус (??), 15:24, 28/06/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Почему-то не удивило, что это программа - японская
     
  • 1.7, Аноним (-), 17:35, 01/07/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Война давно кончилась, а истинный самурай так и бегает с винтовкой^W CVSом наперевес, потому что настоящий самурай не сдается.
     
  • 1.8, Аноним (-), 19:08, 03/07/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Шикарно: поставить из убунтовских реп, убедиться, что не работает, поставить с офсайта.
    Одному мне кажется, что первые два пункта в публичном мануале совершенно необязательны?
     
  • 1.9, вуглускр (?), 12:55, 09/07/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > Создаём файлы конфигурации по образу /usr/share/doc/julius-voxforge/examples/julian.jconf.gz. На базе sample.grammar и sample.voca создаём модели грамматики фраз и команды

    Ну да, всё просто: надо всего лишь, без знания принципов обработки голоса, создать модели грамматики фраз! Конечно, вы можете скачать готовые файлы для русского языка, но они всё равно не работают.

    Архиполезнейше!

     
  • 1.10, muon (ok), 17:21, 10/07/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Что делает эта штука? Я надеялся, что я ей звук — она мне букву, но смущают эти "модели грамматики". Что это, понятия о словах? Такая штука должна работать на уровне звуков и не знать про слова.
     
     
  • 2.11, Aquarius (ok), 13:00, 11/07/2012 [^] [^^] [^^^] [ответить]  
  • +/
    сюрприз номер один: между звуками нет однозначного соответствия ни в одну, ни в другую сторону
    сюрпиз номер два, почти прямое следствие первого: системы распознавания от адекватных создателей не работают по этому принципу
    сюрпиз номер три: даже вы в своих словах косвенно это проявили - не сказали "Я надеялся, что я ей букву — она мне букву"
     

  • 1.13, Аноним (-), 19:31, 30/07/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    я гляжу, весь пригодный софт для распознавания голоса ушел в тень, софт активно разрабатывается в глубинах корпораций и т.п.
     
  • 1.14, Вася (??), 14:22, 03/08/2013 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    > я гляжу, весь пригодный софт для распознавания голоса ушел в тень

    Сегодня в полдень начал разбираться с Юлией, да к тому же на пьяную голову. Но, успехи уже есть, слова распознаёт, но проблемы с транскрипцией, не могу многие слова подобрать нормально - он меня не понимает и плюётся, приходится по пол часа на слово тратить. Если слова подобрать длинные и редкие, то не будет случайных срабатываний.

     
  • 1.15, op (??), 21:20, 02/05/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    что бы не пересобирать всю жульку для алсы, можнос сделать:
    atp-get install oss-compat
    aoss julius -input mic -C julian.jconf
     


     Добавить комментарий
    Имя:
    E-Mail:
    Заголовок:
    Текст:




    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру