URL: https://www.opennet.ru/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 126612
[ Назад ]

Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 8.0"

Отправлено opennews , 31-Янв-22 09:25 
Компания Mozilla представила обновление наборов голосовых данных Common Voice, включающих примеры произношения около 200 тысяч людей. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился на 30% -  с 13.9  до 18.2 тысяч часов речи. Число поддерживаемых языков возросло с 67 до 87...

Подробнее: https://www.opennet.ru/opennews/art.shtml?num=56608


Содержание

Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноньимъ , 31-Янв-22 09:25 
Есть же аналог GPL для медиа файлов?
Общественное достояние защищает от претензий?

А как насчёт согласия людей в этих данных?


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 10:13 
> А как насчёт согласия людей в этих данных?

( ͡° ͜ʖ ͡°)


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Жироватт , 31-Янв-22 10:18 
1. Семейство лицензий Creative Commons - это он и есть. Аналог копилефта не на программный код, а на творческие произведения.
2. Да, кроме близких к собственническим CC BY-NC-ND и CC BY-NC-SA. CC0 - аналог общественного достояния
https://creativecommons.org/licenses/?lang=ru
3. "Отправляя ваши данные ... бла-бла-бла ... вы согласны, что они будут распространятся под СС0 и отказываетесь от всех претензий". Тут уже был срачи про такие договоры, вполне себе легальная акцепт-офертная схема

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноньимъ , 31-Янв-22 10:46 
Спасибо, интересно.


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Корец , 31-Янв-22 09:29 
>распространение записей во вносящем искажения формате MP3.

И что им мешает использовать другой формат?


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 09:33 
А что тебе мешает забить на это? Ну серьезно, не пофиг ли?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 10:14 
FLAC рулит! Благо сейчас накопители большого объема — не роскошь.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 09:39 
На что денег хватило.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Жироватт , 31-Янв-22 10:10 
Современные "погромисты" из мозиллы вряд ли знают что-то кроме МРЗ - Московского РадиоЗаавода.
Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.
А может все гораздо проще? Функции-заклинания из библиотеки-гримуара для эмпэтри они вызывать научились, а потом просто тяп-ляп и в продакшн?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Skullnet , 31-Янв-22 15:50 
> Про OGG слышали, наверное, единицы, а про форматы без потерь так вообще одни легенды ходят.

opus лучше.


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 01-Фев-22 07:19 
opus - патентованное говно.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 05-Фев-22 19:10 
Можно поподробнее? Какие ограничения у opus?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Ууууу... , 07-Фев-22 13:31 
Нет, не лучше. Он вносит кучу отсебятины в исходный сигнал, чтобы замаскировать искажения от потерь. На слух терпимо, а вот по приборам - сущий ад. Самый честный в этом плане в настоящий момент - AAC. Ну или LossyFlac/LossyWav.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Alice Ventus , 31-Янв-22 11:17 
А зачем?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 11:29 
А затем, чтобы не приходилось при использовании модели кодировать/раскодировать звук из микрофона в mp3 для лучшего распознавания.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Генри Форд , 31-Янв-22 09:35 
Некогда один из лучших браузеров успешно закопали, теперь можно и в синтез речи поиграться.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 12:01 
Синтез речи это здорово на самом деле. Правда нее очень понятно, почему этим занимается "браузер".

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Владимир , 31-Янв-22 09:43 
Они что, всех белорусов опросили? Откуда такой большой скачок для них?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 10:43 
> Они что, всех белорусов опросили?

Хаха... А ещё, судя по всему, всех оставшихся в мире носителях русского языка: "русского языка охватывает 2452 участника".

> Откуда такой большой скачок для них?

Простой гуглинг подсказывает, что была новость на самом большом (по посещаемости) сайте байнета (новостном). И куча перепечаток на новостных сайтах поменьше.


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Андрей , 31-Янв-22 15:13 
Просто выступления Лукашенко под разными именами записали))

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 12:10 
>распространение записей во вносящем искажения формате MP3

Использовать для хранения Ogg Vorbis не судьба?


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Жироватт , 31-Янв-22 12:15 
Чува-а-а-ак, это надо раскуривать либы к ворбису. А это НЕ потраченное на смуззи и травлю сторонников Трампа в твиттере время. Смекаешь?

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 12:21 
затея изначально дно, либо поставляйте лосслесс либо вы саботируете развитие технологий совершая преступление против человечества

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 15:08 
Лослесс проприетарный, лучше от него держатся подальше. FLAC - копилефтный формат.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Андрей , 31-Янв-22 15:16 
flac к сведению без потерь, плюс есть ещё несколько форматов без потерь, которые свободны. С другой стороны даже флак будет означать, что 5ГБ превратятся в 40-80 ГБ, что ПМСМ совсем плохо, особенно если вообще взять белорусский или английский.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 15:25 
Сегодня такой размер датасета это ни о чём, особенно учитывая, в каких условиях будут тренировать сети. Можно хоть вообще wave формат раздавать. И да, голос весьма эффективно жмётся.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 18:08 
>Можно хоть вообще wave формат раздавать.

WAVE - маздаевский, его использовать не надо. Всё что создано Microsoft должно быть уничтожено.


"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 02-Фев-22 11:40 
При этом нормального аналога так и нет.
Кстати, у RIFF ноги ещё с Амиги растут.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 15:29 
Флак не копилефтный, копилефтные только консольные утилиты для работы с ним. Мп3 для сравнения как формат только пару лет назад перестал быть проприетарным и требовать отчислений за использование (и то с оговорками емнип) и это как-то не мешало использовать его как в коммерческом так и в свободном софте (в основном конечно в коммерческом, потому что кому интересно платить отчисления).

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 31-Янв-22 18:10 
Какое жалкое стремление, во чтобы ни стало, держаться MP3, у MP3 подпорченная репутация.

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено анон , 31-Янв-22 17:33 
speex /thread

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено soup2 , 01-Фев-22 08:34 
Двачую xDDDDD

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено Аноним , 01-Фев-22 12:09 
deprecated

"Обновление голосовых данных Mozilla Common Voice 8.0"
Отправлено adolfus , 02-Фев-22 23:38 
Цырк. В стародавние времена (1997???) в составе дистрибутива IBM OS/2 4.0 Merlin было приложение VoiceType. Оно не только "произносило" тексты, но и записывало их под диктовку. Правда, на английском, но отлично обучалось советскому произношению диктовавшего. И все это работало на первом пентиуме со ста двадцатью мегабайтами памяти.