Естественный звуковой текст для речи?

71

Я ищу несколько простых в установке программ для преобразования текста в речь для Ubuntu, что звучит естественно. Я установил Festival , Gespeaker и т. Д., Но ничего не звучит очень естественно. Все очень синтетические и трудно понять.

Какие-нибудь рекомендации там?

    
задан I Heart Ubuntu 20.07.2011 в 19:36
источник

13 ответов

17

Я считаю, что я нашел лучшее программное обеспечение TTS бесплатно, используя расширение Google Chrome под названием «SpeakIt». Это работает только в браузере Chrome для меня на Ubuntu. По какой-то причине он не работает с Chromium. SpeakIt поставляется с двумя женскими голосами, которые кажутся очень реалистичными по сравнению со всем остальным. Есть, по меньшей мере, еще четыре мужчины и amp; женские голоса перечислены в расширениях Chrome при поиске в интернет-магазине Chrome с использованием «TTS» в качестве вашего запроса.

Ссылка

Для использования на веб-сайте. вы выделяете текст, который хотите прочитать, и щелкните правой кнопкой мыши и «SpeakIt» или щелкните значок SpeakIt, прикрепленный к верхней панели Chrome.

Пользователи Firefox также имеют два варианта. В дополнениях Firefox выполните поиск TTS, и вы должны найти «Click Speak», а также «Text to Voice». Голоса не так хороши, как голоса Chrome SpeakIt, но определенно полезны.

Расширение SpeakIt использует технологию iSpeech и по цене $ 20 в год, сайт может конвертировать текст в аудиофайлы MP3. Вы можете вводить текст, URL-адреса, RSS-каналы, а также такие документы, как TXT, DOC и PDF, а также вывод в MP3. Вы можете создавать подкасты, вставлять аудио и т. Д. Вот ссылка ...

Ссылка

и образец их аудио (не знаю, как долго будет длиться ссылка) ...

Ссылка

    
ответ дан I Heart Ubuntu 27.01.2013 в 01:11
источник
44

SVOX pico2wave

В дополнение к другим ответам:

Очень минималистическая TTS, лучшее звучание, чем espeak или mbrola (на мой взгляд).

Некоторая информация:
Ссылка

Я не понимаю, почему pico2wave, по сравнению с espeak или mbrola, редко обсуждаются. Он маленький, но звучит очень хорошо (естественно). Без изменений вы услышите естественный звук женского голоса.

И ... по сравнению с Mbrola, он распознает Units и говорит это правильно!
Например:

  • 2 ° C → две градусы
  • 2m → два метра
  • 2 кг → два килограмма

После установки я использую его в скрипте:

#!/bin/bash
pico2wave -l=de-DE -w=/tmp/test.wav ""
aplay /tmp/test.wav
rm /tmp/test.wav

Затем запустите его с нужным текстом:

<scriptname>.sh "hello world"

или прочитайте содержимое всего файла:

<scriptname>.sh "$(cat <filename>)"

Это все, чтобы иметь легкий, стабильный рабочий TTS на Ubuntu.

    
ответ дан user85321 24.08.2012 в 17:12
11

Простой Google ™ TTS

Из-за отсутствия лучшей альтернативы я написал скрипт bash , который взаимодействует с perl script от Michal Fapso , чтобы предоставить TTS через Google Translate. Из описания проекта:

  

Цель состоит в том, чтобы обеспечить простой в использовании интерфейс для вывода текста в речь через систему синтеза речи Google. Резервный вариант с использованием pico2wave автоматически обеспечивает синтез TTS в случае, если интернет-соединение не найдено.

     

В завершении оболочка поддерживает чтение со стандартного ввода, текстовых файлов и выбора X (выделенный текст).

Основные функции:

  • Онлайн-синтез TTS с помощью Google translate
  • автономный синтез TTS через pico2wave
  • поддерживает различные языки
  • может читать из CLI, текстовых файлов и выделенного текста
  • поддерживает чтение выделенного текста с фиксированным форматированием (например, файлы PDF).

Установка и использование описаны на странице .

Буду рад, если вы попробуете. Отчеты об ошибках и любые другие отзывы приветствуются!

    
ответ дан Glutanimate 23.08.2014 в 21:18
8

Я смотрел высоко и низко для текста в речь для Ubuntu, что является высоким качеством. Здесь ничего нет. Мои голосовые связки парализованы, поэтому мне понадобилось TTS, чтобы добавить голосовые инструкции в мои видео Ubuntu . Вы можете получить коммерческое программное обеспечение для текстового и текстового перевода Linux: Ссылка Это просто очень дорого. Я закончил покупку Natural Reader для Windows (не работает в Ubuntu под Wine) за 40 долларов. Возможно, позже я получу Linux.

Я надеюсь, что это поможет.

    
ответ дан Joe Steiger 20.07.2011 в 19:57
6

Я проводил исследования по лучшим звучащим и легко настраиваемым текстам в речь. Ниже приведен список того, что я считал лучшими 5 продуктами в порядке качества звука. На большинстве веб-сайтов, связанных с этим продуктом, есть интерактивная демонстрация, которая позволит вам сделать свое собственное определение.

  1. NeoSpeech
  2. IVONA
  3. Acapela
  4. AT & amp; T Естественные голоса
  5. Голоса CereProc
ответ дан Jim 24.04.2012 в 17:35
6

Pico и espeak - это весело и легко добраться до работы, но они не все так хорошо. Голоса фестиваля по умолчанию также не так хороши. Тем не менее, Фестиваль представляет собой основанную на схемах речевую структуру, в которой ряд исследователей создали гораздо лучшие плагины. Вы можете легко превзойти качество pico2wave на складе Ubuntu, потому что один из этих голосов доступен в виде готового пакета.

Чтобы сделать фестиваль естественным, вот что делать:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Вы можете сделать это из командной строки, используя -b (или --batch ) и поместив каждую команду в одинарные кавычки:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Вы можете получить другие неплохие голоса из репозитория Nitech, но их установка является исчерпывающей, и пути по умолчанию изменились, поэтому ссылки на имена файлов в связанных файлах схемы, возможно, придется отредактировать вручную, чтобы работать на складе Ubuntu.     

ответ дан Jon Watte 25.04.2017 в 21:31
5

Объедините инструменты SVOX (pico) с LibreOffice:

Инструменты SVOX (pico) просты в установке и обеспечивают хорошее качество голосов в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив расширение "Читать текст" и вы получите «GUI» для этого превосходного программного обеспечения TTS:

Настроить параметры чтения текстового расширения с помощью Инструменты - надстройки - выбор для чтения. ... Используйте / usr / bin / python как внешнюю программу. Выберите параметр командной строки, включающий токен (PICO_READ_TEXT_PY) , вы можете поэкспериментировать с некоторыми из них.

Теперь вам нужно только выбрать текст в LO Writer, Calc, Impress или Draw и кликнуть значок, добавленный как панель инструментов (счастливое лицо с баллоном).

    
ответ дан leoperbo 15.12.2013 в 01:48
4

Я нахожу голоса Nitech HTS на фестивале очень естественными и утешительными по поводу любых других голосов, которые я слышал. Смотрите эту ссылку о том, как настроить Nitech и другие звуки с фестивалем. Я не нашел хорошего gui, который я могу использовать для настройки этих голосов, но установка их через festival.scm все еще работает. Этот пост очень старый, и вы можете найти фактический каталог установки, используя команда «locate festival»

    
ответ дан razor 09.11.2011 в 14:56
4

Вот что я сделал, чтобы иметь чисто естественную речь для pdf и других текстовых файлов (другие решения не являются естественными или они просто платные услуги). Это на самом деле работа вокруг хрома или хрома, но работает быстро и легко.

  1. Установите расширение SpeakIt! на вашем хроме или хроме.
  2. Установите PDF Viewer , если вы используете хром (у хром уже есть pdf зрителя бесплатно) и установите флажок «Разрешить в инкогнито» и «Разрешить доступ к файлам URL» в настройках расширений хрома.
  3. Перетащите свой pdf-файл в браузер.
  4. Теперь выделите текст и щелкните правой кнопкой мыши и выберите SpeakIt! поэтому вы можете слушать чистый естественный текст в речь.

Также есть способы открыть другие файлы, такие как .doc и .txt в chrome, и сделать то же самое. Существуют другие расширения для хром, которые просматривают pdf-файлы, проверяют, подходит ли вам это. Кроме того, вы можете загружать все тексты на Google Диске и использовать SpeakIt! прочитать его для вас. Другое расширение, называемое «Говорить текст», работает одинаково и имеет естественную речь.

    
ответ дан Pooya Sanooei 12.12.2013 в 02:54
2

, когда вы ищете лучший движок tts для использования в новом режиме firefox 49 , я нашел pico tts (svox) - мой любимый движок TTS.

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Как изменить систему синтеза речи по умолчанию?

Люди в arch linux вернули меня на правильный путь ( Ссылка ):

Раскомментируйте модуль, который вам нравится, и сделайте его по умолчанию в настройках речевого-диспетчера:

#> vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Перезапустите демон:

#> sudo systemctl restart speech-dispatcher.service

НО, при запуске firefox снова ничего не происходит. Согласно ссылке выше (сообщение № 10 и №16 в архаре) работает с фестивалем (не пробовал), но речевой диспетчер для пико не перечисляет доступные голоса. Он не будет работать.

Любая идея была бы высоко оценена; -)

    
ответ дан apos 14.11.2016 в 23:55
1

Моя любимая программа для преобразования текста в речь называется Magic English, но, как и Natural Reader, упомянутая Джо Стигером, это программа для Windows, и я не уверен, что она будет работать под Wine.

AT & amp; T Natural Voices доступен онлайн как демонстрация, но это скорее работа, вокруг решения ...

    
ответ дан Chris Granger 20.07.2011 в 21:10
0

Для этого я создаю Интеллектуальный динамик - расширение для Google Chrome. Он может читать страницы даже без выбора (при правильном содержании текста).

    
ответ дан Vitaly Zdanevich 16.09.2017 в 20:02
0

Google TTS

Pico, mbrola, cmu, фестиваль, flite, все SUCK в 2017 году (они были потрясающими в 90-х годах). AT & amp; T естественная речь (что является фантастическим) не является совместимым с linux, и это не бесплатно, поэтому мы используем Google

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s 'pwd'/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
    
ответ дан Jonathan Leaders 29.11.2017 в 06:32