The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]



"Компания Mozilla представила систему синтеза речи LPCNet"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от opennews (ok), 20-Ноя-18, 21:14 
Компания Mozilla развивает (https://hacks.mozilla.org/2018/11/lpcnet-dsp-boosted-neural-.../) новую систему синтеза речи LPCNet (https://people.xiph.org/~jm/demo/lpcnet/), которая дополняет ранее запущенную (https://www.opennet.ru/opennews/art.shtml?num=47648) инициативу по разработке системы  распознавания речи. LPCNet обеспечивает более эффективный синтез речи благодаря комбинированию традиционных методов цифровой обработки сигналов (DSP)  с механизмами синтеза на основе машинного обучения.


Несмотря на то, что современные модели синтеза речи на основе нейронных сетей, такие как WaveNet (https://deepmind.com/blog/wavenet-generative-model-raw-audio/), позволяют добиться превосходного качества синтеза, их реализация сильно усложнена и требует большой вычислительной мощности. Данная особенность затрудняет использование подобных систем для синтеза речи в режиме реального времени на таких устройствах, как телефоны. В качестве выхода в LPCNet предлагается (https://jmvalin.ca/papers/lpcnet_icassp2019.pdf) использовать первичный синтез с использованием DSP с последующим применением нейронной сети для улучшения результата.

Помимо синтеза речи LPCNet также может применяться и в других областях, требующих повышения качества голосового сигнала. Например, LPCNet подходит для создания технологий сжатия речи для передачи по низкоскоростным каналам связи, для устранения шумов, для изменения скорости воспроизведения речи, для фильтрации результата работы различных кодеков и для синтезирования недостающих фрагментов, утерянных из-за потери пакетов.


Исходные тексты реализации LPCNet распространяются (https://github.com/mozilla/LPCNet) под лицензией BSD. Код написан на языке Си с использованием Keras (https://keras.io/), высокоуровневого фреймворка для построения нейронных сетей, который может работать поверх TensorFlow, CNTK и Theano. Для работы требуется
GPU (достаточно GT1060, но для обучения модели рекомендуется использовать более мощный GPU с поддержкой CUDA и CUDNN, напрмер GTX 1080 Ti). Для загрузки доступны (https://jmvalin.ca/misc_stuff/lpcnet_models/) уже готовые модели, натренированные на голосовых данных (http://www-mmsp.ece.mcgill.ca/Documents/Data/) от лаборатории университета Макгилла. Систему можно обучить и на своих данных, для этого потребуется несколько часов аннотированных записей голоса.


URL: https://hacks.mozilla.org/2018/11/lpcnet-dsp-boosted-neural-.../
Новость: https://www.opennet.ru/opennews/art.shtml?num=49639

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Компания Mozilla представила систему синтеза речи LPCNet"  +11 +/
Сообщение от timur.davletshin (ok), 20-Ноя-18, 21:14 
Достаточно GT1060 для работы синтеза речи? Да вы поболели там чтоли? У меня 16-18 лет назад синтезатор речи на компьютере уровня второго пня работал если и чуть хуже, но не кардинально для понимания.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Ilya Indigo (ok), 20-Ноя-18, 21:20 
Мне на линуксе до сих пор Алёны не хватает. :-(
http://hire7.net/2008/08/18/golosovojj_dvizhok_acapela_alyon...
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от timur.davletshin (ok), 20-Ноя-18, 21:29 
Честно говоря, сейчас я им не пользуюсь. Но тот, что стоит по-умолчанию в Debian — это тихий ужас, festival в 10 раз лучше.
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "Компания Mozilla представила систему синтеза речи LPCNet"  +7 +/
Сообщение от 84701 (?), 20-Ноя-18, 21:38 
под линукс есть только один синтезатор на русском нормальный ,на сколько я знаю, - это RHVoice. Мозиловцы лучше бы сделали нейросеть которая анализирует на видеокарте аудиозапись речи и созадёт файл для фестивала или flite с голосом, который работал бы без видеокарты,а то что они придумали это лажа...
Ответить | Правка | ^ к родителю #3 | Наверх | Cообщить модератору

6. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Vitaliy Blatsemail (?), 20-Ноя-18, 21:50 
> под линукс есть только один синтезатор на русском нормальный ,на сколько я знаю, - это RHVoice. Мозиловцы лучше бы сделали нейросеть которая анализирует на видеокарте аудиозапись речи и созадёт файл для фестивала или flite с голосом, который работал бы без видеокарты,а то что они придумали это лажа...

Плюсую за RHvoice

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

17. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Константавр (ok), 20-Ноя-18, 23:23 
Сам синтезатор может быть очень хорошим, но если его интеграции нигде нет, то как пользоваться?
Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

18. "Компания Mozilla представила систему синтеза речи LPCNet"  –2 +/
Сообщение от Vitaliy Blatsemail (?), 20-Ноя-18, 23:30 
> Сам синтезатор может быть очень хорошим, но если его интеграции нигде нет, то как пользоваться?

Тут собственно вопрос не в интеграции, а в простом человеческом ненужно.

Я не знаю например ни одного реального юзкейса применения синтезатора кроме интерактивных автоответчиков. А ты ?

Там где нужен голос - проще записать несколько дорожек на все случаи жизни.

Но все равно область применения этого всего я представляю смутно. Одно время пробовал повесить RHvoice на мою самописную тулзу для мониторинга серверов (аки Nagios). Классно. Если друзьям показать. А вот если с этим находиться в одной комнате, то уже все не так радужно.

Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору

19. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (19), 20-Ноя-18, 23:51 
Книги, сайты читать, не?
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

27. "Компания Mozilla представила систему синтеза речи LPCNet"  +3 +/
Сообщение от Vitaliy Blatsemail (?), 21-Ноя-18, 02:32 
> Книги, сайты читать, не?

Не.

Во-первых, ты уверен что хочешь слышать все что выводит сайт форумы поиск регистрация скачать бесплатно без смс мокрые писечки ?

Во-вторых, проанализируй свой собственный алгоритм прочтения книги. Например ребенку. Интонации. Ударения. Повышение и понижение голоса в зависимости от сцены. На основе чего ты выбираешь интонацию. Когда ускоряешься, а когда наоборот замедляешься. Без этого всего, чтение книги будет лишь монотонным бубнением, и основная проблема здесь не диктовка, а как раз восприятие написанного. Ну а чтобы воспринимать написанное нужен весьма недурственный такой ИИ, при чем не тот которым называют хипсторские парсеры на Go или пицтоне, а именно обучаемый.

Ответить | Правка | ^ к родителю #19 | Наверх | Cообщить модератору

36. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Константавр (ok), 21-Ноя-18, 08:43 
Иногда нужно просто прочитать текст. Не важно как. Хоть почту зачитать, Хочу посидеть с закрытыми глазами и пусть он читает. В конце концов, зачем весь этот прогресс? Давно уже должны были голосовыми командами управлять компьютером и чтобы он читал.
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

39. "Компания Mozilla представила систему синтеза речи LPCNet"  +6 +/
Сообщение от нах (?), 21-Ноя-18, 10:02 
я тоже не понимаю, зачем весь этот прогресс - еще три тысячи лет назад раб прекрасно читал свиток, как положено, с интонациями и внятным голосом. Можно было сидеть, закрыв глаза, и нормально слушать. Если раб сбивался или шепелявил, его просто отправляли в каменоломню.
Теперь раб зачем-то пишет кривой код, бубнящий невоспринимаемую информацию, а свиток еще и ocr обрабатывает - тоже отвратительно и с кучей проблем на пустом месте. Да еще и вместо каменоломни едет в Гоа.

Ответить | Правка | ^ к родителю #36 | Наверх | Cообщить модератору

46. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от hokum13email (?), 21-Ноя-18, 11:55 
Раб - не человек. Раб - вещь. Раба можно купить, продать, утилизировать (не убить, он не человек), использовать как игрушку (во всех смыслах),... А современному наемнику нужно платить ЗП, соблюдать права, и т.д..
Да, с рабами было проще. Но кто Вам сказал, что Вы не были бы рабом?
Ответить | Правка | ^ к родителю #39 | Наверх | Cообщить модератору

71. "Компания Mozilla представила систему синтеза речи LPCNet"  –1 +/
Сообщение от нах (?), 22-Ноя-18, 12:58 
и чего - быть прикованным к монитору вам больше нравится, чем читать свитки хороших авторов?

а утилизировать, использовать и так далее - вас и сейчас прекрасно получится.

Ответить | Правка | ^ к родителю #46 | Наверх | Cообщить модератору

40. "Компания Mozilla представила систему синтеза речи LPCNet"  +3 +/
Сообщение от MihaNix (?), 21-Ноя-18, 10:13 
Не мало людей с проблемами по зрению.
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

47. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (47), 21-Ноя-18, 12:37 
Но ведь здоровые о них никогда не думают, пока сами не ослепнут, верно?
Ответить | Правка | ^ к родителю #40 | Наверх | Cообщить модератору

53. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от Vitaliy Blatsemail (?), 21-Ноя-18, 15:45 
> Не мало людей с проблемами по зрению.

И ты хочешь чтобы к ним добавились проблемы со слухом?)

Ответить | Правка | ^ к родителю #40 | Наверх | Cообщить модератору

77. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Pilat (ok), 22-Ноя-18, 23:49 
Я помню своего деда, постепенно теряющего зрение. Этого мне достаточно чтобы понять важность TTS программ. Тогда их не было...
Ответить | Правка | ^ к родителю #53 | Наверх | Cообщить модератору

79. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Vitaliy Blatsemail (?), 23-Ноя-18, 03:09 
> Я помню своего деда, постепенно теряющего зрение. Этого мне достаточно чтобы понять важность TTS программ. Тогда их не было...

spp.exe

Эх ты, поколение ВНО :)

Ответить | Правка | ^ к родителю #77 | Наверх | Cообщить модератору

90. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Pilat (ok), 08-Фев-19, 10:40 
>> Я помню своего деда, постепенно теряющего зрение. Этого мне достаточно чтобы понять важность TTS программ. Тогда их не было...
> spp.exe
> Эх ты, поколение ВНО :)

Я даже помню этот жуткий голос из спикера . Это не TTS.

Ответить | Правка | ^ к родителю #79 | Наверх | Cообщить модератору

43. "Компания Mozilla представила систему синтеза речи LPCNet"  –7 +/
Сообщение от DenisLp (?), 21-Ноя-18, 11:15 
"Интонации. Ударения. Повышение и понижение голоса в зависимости от сцены"
Это все не нужно, если сконцентрироваться на смысле. Кроме того, при наличии настоящей озвучки книги, я все равно выбираю искусственную, потому что она нейтральная, ей все равно что читать, без своих эмоций на происходящее.
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

45. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от hokum13email (?), 21-Ноя-18, 11:51 
"Читал" много фантастики Говорилкой. Сначала (и как говорили со стороны) - полная белеберда. Не разобрать слов и голос режет слух, не говоря уже о том, что скорость 120 слов в минуту.

Но через 3-4 часа я привык и к скорости, и к тону, и к не всегда корректному распознаванию знаков препинания (вопросительная интонация, вместо восклицательной). Даже к тому, что некоторые имена распознавались как сокращения (например имя Дес звучало как "десятичный").
А самое интересное, что после привыкания я стал не только понимать интонацию, но и воспринимать голоса героев по-разному. Мозг сам подстроился и стал добавлять то, что отсутствовало в озвучке. Примерно также, как и при чтении бумажной книги.

Короче говоря вполне применимо, для чтения книг без картинок и формул. А с учетом того, что за мониторами я и так провожу по 10-12 часов в сутки, чтение синтезатором - хороший выбор.

Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

58. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (58), 21-Ноя-18, 21:12 
Обалдеть. Раньше нам обещали что компьютеры будут всё умнее и ИИ поможет жить и будет подстраиваться под человека. А по факту получаем отупление и упрощение - человек подстраивается под машину. Рубилиштейна тватцать читири, ага.
Ответить | Правка | ^ к родителю #45 | Наверх | Cообщить модератору

73. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Урри (?), 22-Ноя-18, 13:16 
Знаю я одного такого. Он через неделю сам стал говорить как эта говорилка - равномерные паузы, отсутствие интонации...

Наx так жить?

Ответить | Правка | ^ к родителю #45 | Наверх | Cообщить модератору

74. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (74), 22-Ноя-18, 21:05 
> Он через неделю сам стал говорить как эта говорилка

не показатель, проф. чтеца слушать трудно, он неискреннен, он слишком присутствует, он непостоянен, а на машинном синтезе (без нейросети) все форманты одинаковы, что уж не нравится подправляешь транскрипцией. нет, хорошо конечно, что есть люди легко воспринимающие анимированный щебет

Ответить | Правка | ^ к родителю #73 | Наверх | Cообщить модератору

75. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от DenisLp (?), 22-Ноя-18, 21:49 
Во первых, Говорилка это просто GUI, а не движок, во вторых, профессиональные движки вроде IVONA давно уже говорят с интонацией и ударением.
Ответить | Правка | ^ к родителю #73 | Наверх | Cообщить модератору

78. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Сергей (??), 23-Ноя-18, 01:44 
Действительно после 10 часов за чтением нормативной документации на работе, прослушивание новостей на максимальных скоростях в говорилке самое то. Но если для Винды есть Balabolka, то для Ubuntu или Manjaro через костыли приходится прикручивать RHVoice, что для гуманитария не очень удобно. RHVoice на линукс запускаю в итоге через самописную недоделанную програмку на питоне (предложения с кавычками не читаются, приходится удалять перед вскармливанием движку) или в терминале, что совсем неудобно.
Ivona довольно хороший движок с голосами Максим (им говорит робот-матершинник из Бостондинамикс на каналах Ютюба) и Татьяна, но вот в коммерческих целях их использовать нельзя (так написано в лицензионном соглашении). В общем в свободное время планирую кидать жалобы с целью заблокировать ютюб-каналы монетизирующие трафик,которые используют эти голоса, дабы стимулировать развитие опенсора))      
Ответить | Правка | ^ к родителю #45 | Наверх | Cообщить модератору

84. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (-), 02-Дек-18, 10:53 
> Но через 3-4 часа я привык и к скорости, и к тону,

Ну не, так не пойдет. Такой голосовой интерфейс создает больше проблем чем решает. Напоминает мне голосовой набор в мобиле. Вроде, удобная штука была. Но вот при полусотне контактов с голосовыми тегами имеет свойство выбирать совершенно не того кого просили. После пары звонков совершенно не тем кому хотелось и результирующих непоняток - фича как-то была отложена в дальний угол и забыта.

Ответить | Правка | ^ к родителю #45 | Наверх | Cообщить модератору

80. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Вулх (?), 23-Ноя-18, 18:39 
Какая интонация, какие ударения, я книги читаю молча, никому в поезде не интересно что я там читаю, ударения все современные синтезаторы умеют ставить, надо просто словарик подгрузить.
Читалки часто и многие используют для чтения книг, не все книги озвучивают ибо профессионально.
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

89. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от neit95 (ok), 06-Янв-19, 03:04 
Некро, но отпишусь)
Соглашусь по поводу книг. Как-то немного удосужился поиграть в театре. Сцена была с двумя актёрами. Самым нудным было учить диалог. Решил немного автоматизировать: говорю свою речь, шлёпаю пробел, комп мне отвечает речь апонента, потом опять я свою и т.д. Быстро накостылял на этом самом RHVoice, попробовал и понял - хрень. Ты бла-бла с интонацией, паузами  и т.д., а тебе в ответ просто сухая фраза. Немного пожалел, что в RHVoice нет тегов ударений и интонаций (или просто не нашёл). Ранее видел такую фишку в виндузовской озвучивалке.
Ответить | Правка | ^ к родителю #27 | Наверх | Cообщить модератору

22. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Константавр (ok), 21-Ноя-18, 00:02 
Я с грустью вспоминаю кнопку в Konqueror "Зачитать текст". Поскольку система TTS в KDE всегда переживала переломный период, эта кнопка, можно сказать, не работала, но так была нужна. Иногда прям вусмерть. Орки эти читают прям всё где мышка находится, это идиотизм какой-то. RHVoice скриптами надо прикручивать... А ещё альтернативы? Никаких не знаю.


Пока молод и горяч оно всё кажется, "да кому это надо?", а как болезнь какая прижмёт, или старость, то оказывается, что одни могли бы сделать, но им не нужно. А другим нужно, но сделать это вслепую не очень получается.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

32. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 07:07 
Область применения таких вещей — нагружать всякой разрекламированной чепухой твою видеокарточку и другое железо, чтобы ты их регулярно обновлял. Никаких других реальных применений нет. За продвижением «сумасшедших инноваций» (которые не инновации) типа «криптовалют» (которые не валюты), ИИ (который не ИИ), распознавание образов, речи и так далее стоят крупнейшие вендоры железа. Впрочем, Невидия уже допрыгалась. :)
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

49. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Попугай Кеша (?), 21-Ноя-18, 13:18 
Это просто называется искусственным спросом, чтобы стимулировать продажи. Таково колесо капитализма
Ответить | Правка | ^ к родителю #32 | Наверх | Cообщить модератору

83. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (-), 02-Дек-18, 10:50 
> Это просто называется искусственным спросом, чтобы стимулировать продажи. Таково колесо капитализма

Однако ж в этом есть и рациональное зерно...
- Компьютер, свет!
- Исполняю.

А поди удобно, если это прям из теплой кровати, не шарясь в темноте по выключателю...

Ответить | Правка | ^ к родителю #49 | Наверх | Cообщить модератору

37. "Компания Mozilla представила систему синтеза речи LPCNet"  –3 +/
Сообщение от Ilya Indigo (ok), 21-Ноя-18, 09:11 
> Я не знаю например ни одного реального юзкейса применения синтезатора кроме интерактивных
> автоответчиков. А ты ?

1 Вы, а не ты!
2 Книги, документы, мессенджеры, да эти же комментарии.
3 У фестиваля задержка в несколько секунд перед началом и загрузка проца в этот момент. У акапелы такого не было, читала сразу и проц не грузила.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

48. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (47), 21-Ноя-18, 12:43 
> Я не знаю например ни одного реального юзкейса применения синтезатора кроме интерактивных автоответчиков.

А я хотел бы, чтобы мой смартфончик читал мне в поездке мануал.pdf на новую железку или софтину.

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

82. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (-), 02-Дек-18, 10:48 
> А я хотел бы, чтобы мой смартфончик читал мне в поездке мануал.pdf
> на новую железку или софтину.

Очень интересно как должно выглядеть чтение скриншота, диаграммы, схемы и тому подобных вещей. А без этого - толку то с чтения пдф-а? Не говоря о том что глазами это схватится за полсекунды, а голос будет минуту это жевать.

Ответить | Правка | ^ к родителю #48 | Наверх | Cообщить модератору

50. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от Crazy Alex (ok), 21-Ноя-18, 13:39 
Тут сфера применения - разного рода "умные помощники" - от алексы сотоварищи до интерфейсов в магазинах, телефонных роботов, "горячих линий" и прочего, где надо по-человечески воспроизводить то, что сгенерировано нейросеткой
Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

81. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (81), 02-Дек-18, 10:45 
> Сам синтезатор может быть очень хорошим, но если его интеграции нигде нет,
> то как пользоваться?

А там многое сделано для того чтобы интеграции и не было. Какая-то навороченая плюсятина, с какой-то жутко экзотичной билдсистемой. Захочешь не заинтегрируешь, потому что это явно не предусмотрено.

Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору

7. "Компания Mozilla представила систему синтеза речи LPCNet"  +7 +/
Сообщение от Аноним84701 (ok), 20-Ноя-18, 21:50 
> Мозиловцы лучше бы сделали нейросеть которая анализирует на видеокарте аудиозапись

Лучше бы они сделали нейросеть, которая сама пишет браузер …  

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

9. "Компания Mozilla представила систему синтеза речи LPCNet"  +3 +/
Сообщение от нах (?), 20-Ноя-18, 21:54 
так они, походу, уже сделали. Вот такую фигню и пишет, как и разговаривает.

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

33. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 07:10 
Нейросеть эта, что характерно, частью родом с Индостана, а частью из феминизма.
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

29. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от Анонимный прохожий (?), 21-Ноя-18, 05:26 
> Мозиловцы лучше бы сделали...
> ...а то что они придумали это лажа...

Каждый диванный анон лучше знает, чем заняться другим.

Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

30. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (30), 21-Ноя-18, 05:36 
В случае мозилловцев так и есть. Они давно уже не в ту степь бегут.

если я, вместо того, чтобы оперировать каждый вечер, начну у себя в квартире петь хором, у меня настанет разруха. Если я, входя в уборную, начну, извините за выражение, мочиться мимо унитаза и то же самое будут делать Зина и Дарья Петровна, в уборной начнётся разруха. Следовательно, разруха не в клозетах, а в головах.

Ответить | Правка | ^ к родителю #29 | Наверх | Cообщить модератору

67. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Анонимный прохожий (?), 22-Ноя-18, 06:51 
> Следовательно, разруха не в клозетах, а в головах.

Странноватый пример. Это же свободный проект - люди вольны делать то, что им хочется и в том виде, в каком считают правильным. Несогласные же, в свою очередь, или выбирают другой аналогичный продукт, или пишут свой собственный, если в силах. Мозиловцы не обязаны кому-то угождать, как и все другие.

Ответить | Правка | ^ к родителю #30 | Наверх | Cообщить модератору

68. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от нах (?), 22-Ноя-18, 11:27 
> Это же свободный проект - люди вольны делать то, что им хочется

это свободный проект на деньги мурзила-фоундейшн (отдельный вопрос - откуда у идиотов столько денег и точно ли дело в идиотии). Соответственно, делать они будут то, что требуется.

> Несогласные же, в свою очередь, или выбирают другой аналогичный продукт,

если он существует
> или пишут свой собственный, если в силах.

если в силах убедить очередной фоундейшн дать денег именно им. Это возможно - но писать ты будешь опять же то что хочет новый фоундейшн, а не то что хочешь только ты.

> Мозиловцы не обязаны кому-то угождать, как и все другие.

они обязаны обанкротиться - и к этому, в общем-то, вполне успешно идут. Сколько там уже процентов осталось от их браузера - 6?

А от говорилки денег на зарплату кумарам не обломится. Яха вон тоже много чего понаразрабатывала, не совсем даже бесполезного - но от банкротства ее спасла только покупка китайского магазина хлама.

Не то чтобы было жалко инвесторов фоундейшна - жалко себя. Потому что выбор, который ты описал, существует только в твоих прекрасных фантазиях. А тот на который я исправил - это не выбор, опять мазила получится.

Ответить | Правка | ^ к родителю #67 | Наверх | Cообщить модератору

70. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от КГБ СССР (?), 22-Ноя-18, 12:34 
>> Мозиловцы не обязаны кому-то угождать, как и все другие.
> они обязаны обанкротиться - и к этому, в общем-то, вполне успешно идут.
> Сколько там уже процентов осталось от их браузера - 6?

Да-да, именно это. Хоть и отгоняет конспирологией, но по-другому не объяснишь. А что, разве плох такой способ убивать конкурентов? Зато все спят спокойно и никто не возмущается: само ведь сдохло. Причём люди за работу получали зарплату, за справедливость боролись.

Ответить | Правка | ^ к родителю #68 | Наверх | Cообщить модератору

21. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от DenisLp (?), 20-Ноя-18, 23:54 
"Мне на линуксе до сих пор Алёны не хватает."
Ивона Татьяна ведь качественнее. А мне не хватает Лиама.
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

24. "Компания Mozilla представила систему синтеза речи LPCNet"  –1 +/
Сообщение от DenisLp (?), 21-Ноя-18, 00:18 
"Мне на линуксе до сих пор Алёны не хватает"
Акапеловские голоса, включая Алену, есть на андроиде, а его с натяжкой можно назвать Линуксом. Также есть на OS X https://www.assistiveware.com/products/infovox-ivox которую с натяжкой можно назвать Unix.
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

60. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от Аноним (60), 21-Ноя-18, 21:27 
OS X к Unix формально больше отношения имеет, чем Linux к Unix. :)
Ответить | Правка | ^ к родителю #24 | Наверх | Cообщить модератору

31. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от iPony (?), 21-Ноя-18, 06:18 
>  синтезатор речи на компьютере уровня второго пня работал если и чуть хуже

Ну сказки рассказывать про "чуть"... Это на простых примерах ещё худо бедно сработает, иначе нет.

Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

5. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (5), 20-Ноя-18, 21:40 
>Код реализации LPCNet написан на языке Си с использованием Keras

ЩИТО?

>Python 99.9% Other 0.1%

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (8), 20-Ноя-18, 21:54 
https://github.com/mozilla/LPCNet/tree/master/src
на Python там только построение нейронной сети.
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

11. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (60), 20-Ноя-18, 22:07 
>Keras is a high-level neural networks API, written in Python and capable of running on top of TensorFlow, CNTK, or Theano.

)

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

28. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (28), 21-Ноя-18, 04:49 
Вы где взяли Python 99.9%?

https://i.imgur.com/JMoxH7O.png

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

41. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (5), 21-Ноя-18, 10:13 
https://github.com/keras-team/keras
Ответить | Правка | ^ к родителю #28 | Наверх | Cообщить модератору

59. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (60), 21-Ноя-18, 21:21 
А ниже спускаться не пробовали?

TensorFlow — С++, Theano — NumPy — C, CNTK — C++. Keras — это API для вышеприведённых фреймворков.

Ответить | Правка | ^ к родителю #41 | Наверх | Cообщить модератору

61. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (5), 21-Ноя-18, 22:22 
речь шла о том, что штука написана на Си. Но из си не имеет смысла пользоваться керасом.
Ответить | Правка | ^ к родителю #59 | Наверх | Cообщить модератору

64. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (64), 22-Ноя-18, 01:32 
Там на C они извлекают данные из файлов. А потом отдельным скриптом на гвидопыхе тренируется. Никто там не пытается запускать Keras из C. Там, по сути, три исполняемых файла, два из которых -- на Python.

Формально штука написана на C и Python (Keras), получается.

Ответить | Правка | ^ к родителю #61 | Наверх | Cообщить модератору

10. "Компания Mozilla представила систему синтеза речи LPCNet"  –2 +/
Сообщение от Аноним (10), 20-Ноя-18, 22:05 
Время от времени Mozilla делает что-то реально полезное.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

85. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (85), 02-Дек-18, 10:58 
> Время от времени Mozilla делает что-то реально полезное.

Я бы сказал что она делает что-то реально монструозное. Как эта помесь сей с питоном к которой без 1060 не подходи. Вспоминая как речь сносно синтезировали еще чуть ли не амиги с процами которые дохлее первопня в разы - ничего кроме фэйспалма сделать не получается. Куда и зачем все это адовое месиво фреймворков предлагается девать?

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

12. "Компания Mozilla представила систему синтеза речи LPCNet"  +3 +/
Сообщение от corvuscor (ok), 20-Ноя-18, 22:14 
И конечно же, оно поддерживает лишь CUDA, причем для работы, а не только для обучения.
Опенсорсность аж по монитору течет.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

13. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (5), 20-Ноя-18, 22:25 
Не совсем верно. Есть реализации CUDA поверх OpenCL, народ говорит, что рабочие и что tensorflow пашет, есть фреймворки для вычислительных графов поверх OpenCL. Благодаря ONNX модели переносятся между фреймворками.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

23. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Константавр (ok), 21-Ноя-18, 00:05 
Ага, надо просто научить пальцы изгибаться в обратную сторону.
Ответить | Правка | ^ к родителю #13 | Наверх | Cообщить модератору

14. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Stax (ok), 20-Ноя-18, 22:32 
Попробуйте на VUDA https://github.com/jgbit/vuda - может заработает?

А вообще это не вина мозиллы. Они же не напрямую CUDA используют! NVidia очень хорошо вложилась в разработку библиотек, в итоге имеем TensorFlow, Theano и прочие, отлично работающие поверх CUDA. Что мешает компании из трех букв (либо кому-то еще) так же хорошо вложиться и обеспечить их работу поверх OpenCL?

У текущих разработчиков на это определенно нет ресурсов, о чем они много раз говорили. Гугл спонсировать работу TensorFlow поверх OpenCL не планирует: https://github.com/tensorflow/tensorflow/issues/22
Поддержка OpenCL в Theano весьма грустная: https://github.com/Theano/Theano/issues/2936 цитирую "We didn't had time to bring this to a usable state. We won't do it.".

Возьмите и вложитесь в разработку! NVidia вот вложилась, предоставила общественности https://developer.nvidia.com/cudnn и пожинает плоды. У людей из оупенсорса, поддерживающих TensorFlow или Theano своих ресурсов на это не хватает. А мозилла тут вообще не причем, использует то, что есть. Хорошего фрейморка не поверх CUDA просто нет.

Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

35. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 07:13 
> Что мешает компании из трех букв (либо кому-то еще) так же хорошо вложиться и обеспечить их работу поверх OpenCL?

Биржевые показатели курса акций Невидии. Имеющий глаза да видит. :)

Ответить | Правка | ^ к родителю #14 | Наверх | Cообщить модератору

51. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Stax (ok), 21-Ноя-18, 14:56 
>> Что мешает компании из трех букв (либо кому-то еще) так же хорошо вложиться и обеспечить их работу поверх OpenCL?
> Биржевые показатели курса акций Невидии. Имеющий глаза да видит. :)

Ммм? Они намного лучше, чем у AMD. Правда, в последние пару недель опустились, когда стал ясен фейл с серией RTX, но это не имеет отношения к CUDA, машинному обучению, теслам и прочим серьезным вещам. Это мелочи, впрочим - снизят премию хуангу https://overclockers.ru/hardnews/show/94527/na-fone-snizheni... и оно снова будет расти (впрочем, уже растет).

Ответить | Правка | ^ к родителю #35 | Наверх | Cообщить модератору

54. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 18:14 
Они сильно просели. Для акционеров нет ничего хуже такой динамики.
Ответить | Правка | ^ к родителю #51 | Наверх | Cообщить модератору

55. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Stax (ok), 21-Ноя-18, 18:26 
> Они сильно просели. Для акционеров нет ничего хуже такой динамики.

Да ну, вообще ни о чем. Все равно выше, чем было полтора года назад. При этом доходы растут; докинут еще на рекламу, будут RTX лучше брать и акции вверх пойдут. А пока это просто повод кому-то хорошо прикупить акций перед ростом.

Вон у AMD обваливалось недавно значительно сильнее - с середины сентября по конец октября более чем в два раза упали. И ничего, пошло вверх.

Ответить | Правка | ^ к родителю #54 | Наверх | Cообщить модератору

56. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 19:56 
Не, это не флуктуация или спекуляция, а есть конкретная причина: Невидия наклепала продукции для майнеров, но реализовать её некуда. Затоварились ребята.

Ещё и Apple посыпались акции. И тоже есть конкретная причина.

Не хотелось бы обнаружить во всём этом закономерность, но таковая в принципе возможна: пузырь капитализации из завтрашних обещаний рано или поздно должен лопнуть. Вонять будет хуже, чем от доткомов. :)

Ответить | Правка | ^ к родителю #55 | Наверх | Cообщить модератору

57. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Stax (ok), 21-Ноя-18, 20:44 
> Не, это не флуктуация или спекуляция, а есть конкретная причина: Невидия наклепала
> продукции для майнеров, но реализовать её некуда. Затоварились ребята.

Ну, пока цена акций все равно выше до-майнингового уровня.

Ответить | Правка | ^ к родителю #56 | Наверх | Cообщить модератору

34. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от КГБ СССР (?), 21-Ноя-18, 07:12 
Кто опенсоссам платит, тот их и опенсоссит.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

15. "Компания Mozilla представила систему синтеза речи LPCNet"  +2 +/
Сообщение от Аноним (15), 20-Ноя-18, 23:03 
а почему не rust?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

16. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним2 (?), 20-Ноя-18, 23:22 
Next version
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

26. "Компания Mozilla представила систему синтеза речи LPCNet"  +6 +/
Сообщение от Аноним (26), 21-Ноя-18, 01:04 
Потому что им надо чтоб работало, а не пердолинг.
Ответить | Правка | ^ к родителю #15 | Наверх | Cообщить модератору

20. "Компания Mozilla представила систему синтеза речи LPCNet"  +3 +/
Сообщение от DenisLp (?), 20-Ноя-18, 23:52 
"Систему можно обучить и на своих данных, для этого потребуется несколько часов аннотированных записей голоса"
Круто, можно увековечить голос любимого человечка.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

25. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (25), 21-Ноя-18, 00:35 
А запинаться, говорить "эмм", "вобщем" и "короче" она тоже научится?
Ответить | Правка | ^ к родителю #20 | Наверх | Cообщить модератору

42. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от анон (?), 21-Ноя-18, 11:03 
Да
Ответить | Правка | ^ к родителю #25 | Наверх | Cообщить модератору

44. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от microcoder (ok), 21-Ноя-18, 11:41 
Интересно, а можно ли проделать следующее. Какому-то Васе звонит его мама:

- Как у тебя дела, сынок? У меня всё хорошо.

Тут же в реалтайме синтезируется другая речь и сыну проигрывается голосом мамы:

- Как у тебя дела, сынок? Вышли мне 1000 рублей на карточку 0001 0001 ...., приболела я...

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

52. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (52), 21-Ноя-18, 15:34 
в ваших мечтах разве что ;)
Ответить | Правка | ^ к родителю #44 | Наверх | Cообщить модератору

62. "Компания Mozilla представила систему синтеза речи LPCNet"  +1 +/
Сообщение от Аноним (5), 21-Ноя-18, 22:32 
Это не в "мечтах". Одну знакомую 5 лет назад так развели. "Мама, я сбил человека" - всем известный уже развод того времени. Вот только позвонили и сказали голосом её сына, а человек был пожилой и от компьюторов далёкий, хотя программы для изменения голоса по по образцу (не такие совершенные, как на нейросетях, но всё же были) есть ещё с 2005 года. И человек вынес все деньги и драгоценности.
Ответить | Правка | ^ к родителю #52 | Наверх | Cообщить модератору

86. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (85), 02-Дек-18, 11:02 
Кстати прецеденты применения синтеза речи для всяких разных дел уже не редкость и не экзотика. Уж позвонить и общаться при помощи синтезатора, чтобы по голосу не узнали - баян из баянов, практиковавшийся лет 10+ назад.
Ответить | Правка | ^ к родителю #62 | Наверх | Cообщить модератору

63. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Ддд (?), 21-Ноя-18, 23:52 
Сегодня выяснилось что Tensorflow либы для Го не работают тк гдето в недрах гугла чето перепахали и уже неск месяцев починить эту пое...нь не могут.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

69. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от нах (?), 22-Ноя-18, 11:30 
игогоши должны страдать
Ответить | Правка | ^ к родителю #63 | Наверх | Cообщить модератору

87. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (85), 02-Дек-18, 11:04 
> игогоши должны страдать

У любого хипста-софта период полураспада не более 2 лет. Любых пихтонрастов касается совершенно одинаково - наворотить гору байтов по быстрому на модную тему они могут. А майнтайнить это - оказывается, грязная и скучная работа, совсем не эпично, блин.

Ответить | Правка | ^ к родителю #69 | Наверх | Cообщить модератору

72. "Компания Mozilla представила систему синтеза речи LPCNet"  –1 +/
Сообщение от DmA (??), 22-Ноя-18, 13:05 
синтез речи добавили, чтобы впендюрить в свой браузер  через месяц запись голоса и отсылать его на сервера гугла и мозиллы?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

76. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от DenisLp (?), 22-Ноя-18, 21:53 
Синтез речи давно уже есть, даже на онтопике работает. А recognition api давно нужно добавить как в хроме, чтобы гуглопереводчику и речевым блокнотам звук скармиливать, а получать транскрипт и/или перевод.
Ответить | Правка | ^ к родителю #72 | Наверх | Cообщить модератору

88. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от Аноним (-), 02-Дек-18, 11:05 
> Синтез речи давно уже есть, даже на онтопике работает. А recognition api
> давно нужно добавить как в хроме, чтобы гуглопереводчику и речевым блокнотам
> звук скармиливать, а получать транскрипт и/или перевод.

Чтобы рекапчу скармливать. А поди плохо, припахать гугла свою же капчу распознавать. Пусть у них роботы там порубаются на предмет кто кого.

Ответить | Правка | ^ к родителю #76 | Наверх | Cообщить модератору

92. "Компания Mozilla представила систему синтеза речи LPCNet"  +/
Сообщение от rvs2016 (ok), 13-Ноя-19, 15:34 
Синтезатор мозиловский - это программа, которую можно установить к себе и озвучивать, например, тексты?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру