<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Компания Mozilla опубликовала голосовые данные Common Voice</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html</link>
    <description>Компания Mozilla опубликовала (https://blog.mozilla.org/blog/2019/02/28/sharing-our-common-voices-mozilla-releases-the-largest-to-date-public-domain-transcribed-voice-dataset/) набор голосовых данных, собранный в результате инициативы Common Voice (https://voice.mozilla.org/) и включающий примеры произношения 42 тысяч людей. В результате инициативы было получено почти 1400 часов речевого материала на 18 языках (русский язык отсутствует), который можно использовать в системах машинного обучения для построения моделей распознавания (https://www.opennet.ru/opennews/art.shtml?num=47648) и синтеза (https://www.opennet.ru/opennews/art.shtml?num=49639) речи. Данные опубликованы (https://voice.mozilla.org/data) как общественное достояние (CC0 (https://creativecommons.org/share-your-work/public-domain/cc0/)).&lt;br&gt;&lt;br&gt;&lt;br&gt;Напомним, что проект Common Voice  нацелен на организацию совместной работы по накоплению базы голосовых шаблонов, учитывающей всё разнообразие голосов и манер речи. Пользователям предлагалось озвучить выводи</description>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (Gannet)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#17</link>
    <pubDate>Fri, 01 Mar 2019 23:31:46 GMT</pubDate>
    <description>санкции (?)&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#16</link>
    <pubDate>Fri, 01 Mar 2019 21:57:42 GMT</pubDate>
    <description>А всё потому что местечковые диалекты нужны не самим &quot;чувашам&quot; и &quot;бурятам&quot;, а для поддержки тезиса многонациональности СССРФ.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (nshmyrev)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#15</link>
    <pubDate>Fri, 01 Mar 2019 21:37:03 GMT</pubDate>
    <description>&amp;gt; Видать нашёлся чуваш, который не знает про опеннет. А то вместо записи &lt;br&gt;&amp;gt; семплов голоса мог бы проводить время с пользой в комментариях.&lt;br&gt;&lt;br&gt;Чувашский и бурятский (и другие тюркские языки) там развиваются не чувашами, а ирландцем на гранты от ВШЭ http://lattice.cnrs.fr/cmld/presentations/presentation_tyers.pdf&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (НяшМяш)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#14</link>
    <pubDate>Fri, 01 Mar 2019 21:22:38 GMT</pubDate>
    <description>Видать нашёлся чуваш, который не знает про опеннет. А то вместо записи семплов голоса мог бы проводить время с пользой в комментариях.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (nshmyrev)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#13</link>
    <pubDate>Fri, 01 Mar 2019 21:15:53 GMT</pubDate>
    <description>Ну и по синтезу (mozilla/TTS)&lt;br&gt;&lt;br&gt;1) Опять скопировали чужой проект на github, назвали своим. Автору пришлось напоминать https://github.com/mozilla/TTS/issues/2&lt;br&gt;2) Куча хороших проектов на тему существует, до сих пор пилят &quot;своё&quot;. Потихоньку копируют, что другие сделали, например, Tacotron2 внесли (скопировали) только сегодня, сходимость моделей была никакая.&lt;br&gt;3) Wavenet так и не добавили.&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (nshmyrev)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#12</link>
    <pubDate>Fri, 01 Mar 2019 21:08:20 GMT</pubDate>
    <description>Китайский тоже только в тайваньском варианте. Неспроста.&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (nshmyrev)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#11</link>
    <pubDate>Fri, 01 Mar 2019 20:59:27 GMT</pubDate>
    <description>Что не так с речью в Мозилле&lt;br&gt;&lt;br&gt;Common Voice:&lt;br&gt;&lt;br&gt;1) собираются голоса молодых людей мужского пола 20-30 лет, нет женских, детских, нет голосов старшего возраста.&lt;br&gt;2) тексты для записи ограничены тысячей предложений, нет вариативности словаря, в дальнейшем будут трудности со словами.&lt;br&gt;3) записи распространяются в mp3, что вносит искажения в голосовой сигнал. Оригиналы не дают, видимо, не хотят конкуренции.&lt;br&gt;4) традиционно вместо того, чтобы развивать существующий проект (voxforge) запилили свой.&lt;br&gt;5) проверка записей делается вручную, хотя может делаться автоматическими средствами.&lt;br&gt;6) сейчас таких данных можно просто накачать с youtube за пару часов в 10 раз больше, чем они собрали за год для всех языков.&lt;br&gt;&lt;br&gt;DeepSpeech&lt;br&gt;&lt;br&gt;1) взяли чужую технологию от Baidu&lt;br&gt;2) за пару лет ничего не сделали, даже не добились нормальной точности, точность гораздо хуже передовых результатов.&lt;br&gt;3) зато кричат о себе на всех углах, получили европейский грант&lt;br&gt;4) когда стало поджимать, скопировали втихушку чужую библиотеку libctcdeco</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (Аноним84701)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#10</link>
    <pubDate>Fri, 01 Mar 2019 19:27:45 GMT</pubDate>
    <description>&amp;gt; Пол &lt;br&gt;&amp;gt;     41&#037;    Мужской &lt;br&gt;&amp;gt;     10&#037;    Женский &lt;br&gt;&lt;br&gt;Это opt-in данные:&lt;br&gt;https://voice.mozilla.org/en&lt;br&gt;см. в самом низу (3 срина, за графиками, логином, аж под картинкой с роботом), &quot;Optional demographic data: sex/age&quot;.&lt;br&gt;Спрятано хорошо -- если не знать, то можно запросто пройти на &quot;запись&quot;/&quot;прослушивание&quot; и не даже не подозревать о своем &quot;упущении&quot;.&lt;br&gt;&lt;br&gt;</description>
</item>

<item>
    <title>Компания Mozilla опубликовала голосовые данные Common Voice (Crazy Alex)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/116705.html#9</link>
    <pubDate>Fri, 01 Mar 2019 19:24:48 GMT</pubDate>
    <description>Забавно, да.&lt;br&gt;</description>
</item>

</channel>
</rss>
