The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Компания Mozilla опубликовала голосовые данные Common Voice"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от opennews (ok), 01-Мрт-19, 20:27 
Компания Mozilla опубликовала (https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-.../) набор голосовых данных, собранный в результате инициативы Common Voice (https://voice.mozilla.org/) и включающий примеры произношения 42 тысяч людей. В результате инициативы было получено почти 1400 часов речевого материала на 18 языках (русский язык отсутствует), который можно использовать в системах машинного обучения для построения моделей распознавания (https://www.opennet.ru/opennews/art.shtml?num=47648) и синтеза (https://www.opennet.ru/opennews/art.shtml?num=49639) речи. Данные опубликованы (https://voice.mozilla.org/data) как общественное достояние (CC0 (https://creativecommons.org/share-your-work/public-domain/cc0/)).


Напомним, что проект Common Voice  нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагалось озвучить выводимые на экран фразы или оценить качество данных, добавленных другими пользователями. Накопленную базу данных c записями различного произношения типовых фраз человеческой речи  без ограничений можно использовать в системах машинного обучения и в исследовательских проектах. До сих пор исследователям и разработчикам были доступны только ограниченные наборы голосовых данных, а стоимость полноценных коллекций голосовых выборок исчислялась десятками тысяч долларов, что сильно тормозило независимые исследования в области распознавание речи.

URL: https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-.../
Новость: https://www.opennet.ru/opennews/art.shtml?num=50229

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


11. "Компания Mozilla опубликовала голосовые данные Common Voice"  +1 +/
Сообщение от nshmyrev (ok), 01-Мрт-19, 23:59 
Что не так с речью в Мозилле

Common Voice:

1) собираются голоса молодых людей мужского пола 20-30 лет, нет женских, детских, нет голосов старшего возраста.
2) тексты для записи ограничены тысячей предложений, нет вариативности словаря, в дальнейшем будут трудности со словами.
3) записи распространяются в mp3, что вносит искажения в голосовой сигнал. Оригиналы не дают, видимо, не хотят конкуренции.
4) традиционно вместо того, чтобы развивать существующий проект (voxforge) запилили свой.
5) проверка записей делается вручную, хотя может делаться автоматическими средствами.
6) сейчас таких данных можно просто накачать с youtube за пару часов в 10 раз больше, чем они собрали за год для всех языков.

DeepSpeech

1) взяли чужую технологию от Baidu
2) за пару лет ничего не сделали, даже не добились нормальной точности, точность гораздо хуже передовых результатов.
3) зато кричат о себе на всех углах, получили европейский грант
4) когда стало поджимать, скопировали втихушку чужую библиотеку libctcdecode, не упомянув автора, выкинув весь свой предыдущий код
5) декодер всё ещё требует 4гб памяти, работает очень медленно
7) в коммитах бесконечно переделывают справку и конфигурационные файлы, ни одного реального улучшения. ну ещё обертки для языков пишут
8) модели не может натренировать простой любитель, нужен суперкомпьютер с 8 GPU

В итоге этот проект недалеко ушёл от предыдущего (мобильной ОС)

Ответить | Правка | Наверх | Cообщить модератору

13. "Компания Mozilla опубликовала голосовые данные Common Voice"  +1 +/
Сообщение от nshmyrev (ok), 02-Мрт-19, 00:15 
Ну и по синтезу (mozilla/TTS)

1) Опять скопировали чужой проект на github, назвали своим. Автору пришлось напоминать https://github.com/mozilla/TTS/issues/2
2) Куча хороших проектов на тему существует, до сих пор пилят "своё". Потихоньку копируют, что другие сделали, например, Tacotron2 внесли (скопировали) только сегодня, сходимость моделей была никакая.
3) Wavenet так и не добавили.

Ответить | Правка | Наверх | Cообщить модератору

1. "Компания Mozilla опубликовала голосовые данные Common Voice"  +1 +/
Сообщение от A.Stahl (ok), 01-Мрт-19, 20:27 
~12GiB
Ответить | Правка | Наверх | Cообщить модератору

2. "Компания Mozilla опубликовала голосовые данные Common Voice"  +4 +/
Сообщение от Анонтоним (?), 01-Мрт-19, 20:53 
Пол
    41%    Мужской
    10%    Женский
Ответить | Правка | Наверх | Cообщить модератору

10. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от Аноним84701 (ok), 01-Мрт-19, 22:27 
> Пол
>     41%    Мужской
>     10%    Женский

Это opt-in данные:
https://voice.mozilla.org/en
см. в самом низу (3 срина, за графиками, логином, аж под картинкой с роботом), "Optional demographic data: sex/age".
Спрятано хорошо -- если не знать, то можно запросто пройти на "запись"/"прослушивание" и не даже не подозревать о своем "упущении".

Ответить | Правка | Наверх | Cообщить модератору

3. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от Аноним (3), 01-Мрт-19, 20:59 
Плохо пиарили.
Ответить | Правка | Наверх | Cообщить модератору

4. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от YetAnotherOnanym (ok), 01-Мрт-19, 21:02 
> русский язык отсутствует

Понятно.

Ответить | Правка | Наверх | Cообщить модератору

5. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от Аноним84701 (ok), 01-Мрт-19, 21:18 
>> русский язык отсутствует
> Понятно.

.
>> As a community-driven project, people around the world who care about having a voice dataset in their language have been responsible
>> Our latest additions include Dutch, Hakha-Chin, Esperanto, Farsi, Basque, and Spanish. In some cases, a new language launch on Common Voice is the beginning of that language’s internet presence

https://discourse.mozilla.org/t/russian-speech/18572
> The best way to contribute right now would be to find and review (or write) sentences in the public domain, and submit at PR to the mai
> и … тишина

Заговор, не иначе!

Ответить | Правка | Наверх | Cообщить модератору

6. "Компания Mozilla опубликовала голосовые данные Common Voice"  +2 +/
Сообщение от Анимус (?), 01-Мрт-19, 21:31 
Кляти иллюминати.
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

17. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от Gannetemail (ok), 02-Мрт-19, 02:31 
санкции (?)
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

8. "Компания Mozilla опубликовала голосовые данные Common Voice"  +2 +/
Сообщение от Коробовemail (?), 01-Мрт-19, 21:59 
Зато есть `Чувашский`.
Ответить | Правка | Наверх | Cообщить модератору

9. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от Crazy Alex (ok), 01-Мрт-19, 22:24 
Забавно, да.
Ответить | Правка | Наверх | Cообщить модератору

12. "Компания Mozilla опубликовала голосовые данные Common Voice"  +1 +/
Сообщение от nshmyrev (ok), 02-Мрт-19, 00:08 
Китайский тоже только в тайваньском варианте. Неспроста.
Ответить | Правка | Наверх | Cообщить модератору

14. "Компания Mozilla опубликовала голосовые данные Common Voice"  +2 +/
Сообщение от НяшМяш (ok), 02-Мрт-19, 00:22 
Видать нашёлся чуваш, который не знает про опеннет. А то вместо записи семплов голоса мог бы проводить время с пользой в комментариях.
Ответить | Правка | К родителю #9 | Наверх | Cообщить модератору

15. "Компания Mozilla опубликовала голосовые данные Common Voice"  +/
Сообщение от nshmyrev (ok), 02-Мрт-19, 00:37 
> Видать нашёлся чуваш, который не знает про опеннет. А то вместо записи
> семплов голоса мог бы проводить время с пользой в комментариях.

Чувашский и бурятский (и другие тюркские языки) там развиваются не чувашами, а ирландцем на гранты от ВШЭ http://lattice.cnrs.fr/cmld/presentations/presentation_tyers...

Ответить | Правка | Наверх | Cообщить модератору

16. "Компания Mozilla опубликовала голосовые данные Common Voice"  –3 +/
Сообщение от Аноним (-), 02-Мрт-19, 00:57 
А всё потому что местечковые диалекты нужны не самим "чувашам" и "бурятам", а для поддержки тезиса многонациональности СССРФ.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру