The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русского языка, opennews (??), 06-Май-21, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


23. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от nshmyrev (ok), 06-Май-21, 12:02 
Не остаёт, это RHVoice древняя технологии. Из более современного есть

https://vc.ru/tribuna/236299-silero-kachestvennyy-bystryy-i-...

Ответить | Правка | Наверх | Cообщить модератору

61. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от Аноним (61), 06-Май-21, 17:52 
Как это подключить к Speech Dispatcher в linux? С RHVoice у меня это получилось.
Ответить | Правка | Наверх | Cообщить модератору

81. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от nshmyrev (ok), 06-Май-21, 20:47 
> Как это подключить к Speech Dispatcher в linux? С RHVoice у меня
> это получилось.

Обернуть в сервер в пару строчек на питоне. Работ меньше, чем rhvoice собирать.

Ответить | Правка | Наверх | Cообщить модератору

93. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  –2 +/
Сообщение от Аноним (93), 07-Май-21, 07:11 
Для этого как минимум питон надо втулить. Особенно хреново для мелких систем, где синтез голоса наиболее прикольно смотрится.

Да еще сайт какой-то совсем наколенный, разглагольстования про пожирон ресурсов, видимо питоннетормозит во весь рост, дикая жаба у авторов - noncommercial only (хотя формально AGPL).

Я не понимаю этих людей. Если кто думает что за ЭТО денег дадут, х... вам, деньги имеет смысл платить за что-то потребное, а не i++'й наколенный питономакет на васянском сайте. И потом рядом такое удивление что проприетарные решения дуром прут. Лол.

Ответить | Правка | Наверх | Cообщить модератору

94. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  –1 +/
Сообщение от Аноним (93), 07-Май-21, 07:14 
p.s. а вот rhvoice реально попробовать пристроить в пару забавных применений, научив мелкие одноплатники забавно ругаться. Оно как бы не коммерческое и для себя, но жаба авторов в паре с явной наколенностью и питонятиной с питорчем... тьфу мерзость какая.
Ответить | Правка | Наверх | Cообщить модератору

117. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от Евгений (??), 08-Май-21, 14:31 
Если не сложно подскажите эти самые пару строчек.

Поиск в google выдает:

Нет результатов для "Silero" "Speech Dispatcher".

Ответить | Правка | К родителю #81 | Наверх | Cообщить модератору

120. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от Аноним (120), 09-Май-21, 02:52 
У них документация не ахти, буков много, а простенькие пример непонятно как запустить (все заточено исключительно под CodeLab). После некоторого тырканья вот чего нарыл - в их примере с TTS не хватает строчек
from IPython.display import Audio в начале
и
voice=Audio(audio[0], rate=sample_rate) в конце
после этого voice.data будет содержать .wav с синтезированной фразой, хош сохраняй на диск, хош - проигрывай звук с него.
Ответить | Правка | Наверх | Cообщить модератору

121. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от Аноним (105), 09-Май-21, 21:29 
кинь на пасту все строчки, лень также тыкаться
Ответить | Правка | Наверх | Cообщить модератору

122. "Выпуск синтезатора речи RHVoice 1.2.4, развиваемого для русс..."  +/
Сообщение от nshmyrev (ok), 09-Май-21, 23:29 
> кинь на пасту все строчки, лень также тыкаться

Вот так на питоне это выглядит:


#!/usr/bin/python3

import torch
import numpy as np
from omegaconf import OmegaConf
from scipy.io.wavfile import write
from silero_models.tts_utils import init_jit_model, apply_tts

sample_rate=16000
device = torch.device('cpu')
models = OmegaConf.load('models.yml')
model_conf = models.tts_models["ru"]["baya_16khz"].latest

model = init_jit_model(model_conf.jit, device=device)
text = 'В н+едрах т+ундры в+ыдры в г+етрах т+ырят в в+ёдра +ядра к+едров.'
audio = apply_tts([text], model, 16000, model_conf.tokenset, device)[0] * 32768
write("example.wav", sample_rate, audio.numpy().astype(np.int16))


Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру