Как установить и использовать программное обеспечение для преобразования текста в речь?

18

Я хочу преобразовать текст в аудиофайл, содержащий синтезированную речь, которая считывает этот текст. Какое бесплатное (libre + gratis) программное обеспечение доступно для этого и как его установить и использовать?

Мне не нужно использовать его в качестве инструмента доступности - я просто хочу, чтобы вы могли слушать мои заметки о пересмотре, выполняя другие действия, например, играть в игры.

    
задан dv3500ea 16.01.2011 в 13:20
источник

8 ответов

17

espeak - хороший инструмент.

Мне просто нравится играть с ним в командной строке. Возможно, вы столкнулись с конфликтом с Pulseaudio, поэтому я использую длинную версию, которая сводит на нет необходимость правильно настроить ее.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help покажет вам варианты калибровки скорости чтения, высоты тона, голоса и т. д.

Когда вы делаете заметки, сохраните их как текстовый файл, а затем:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Затем вы можете играть с ffmeg и другими, чтобы сжать это от PCM до более управляемого, например MP3 или OGG. Но это совсем другая история.

    
ответ дан Oli 16.01.2011 в 13:29
источник
4

Mbrola не работает с 11.10.

Инструменты SVOX (pico) просты в установке, просты в использовании и приносят хорошие голоса в Ubuntu. Установите его:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Еще проще, вы можете использовать LibreOffice в сочетании с инструментами SVOX (pico), установив "Читать текст" расширение , и вы получите «графический интерфейс» для этого превосходного программного обеспечения TTS:

настроить параметры расширенного расширения текста с помощью инструментов - надстроек - прочитать выбор .... Используйте / usr / bin / python в качестве внешней программы. Выберите параметр командной строки, который включает токен (PICO_READ_TEXT_PY).     

ответ дан leoperbo 12.12.2013 в 20:53
3

И еще один espeak gui: gespeaker . Он использует двигатели espeak и mbrola . Кроме того, он имеет больше опций, чем espeak-gui .

    
ответ дан luri 16.01.2011 в 16:03
3

Следующее не является решением FLOSS, но вы можете счесть его полезным. (это решение wine ),

Я лично очень заинтересован в TTS, я использую его довольно часто ... например. слушая бессвязный дискурс, который я бы никогда не потрудился придерживаться другого (потому что мне нужно получить еще одну чашку кофе ... :)

Несколько вещей, которые я обнаружил по пути .. или я должен сказать, вещи, которые я не обнаружил на этом пути ... Скажем прямо: каждый фрагмент голоса FOSS TTS программное обеспечение, которое я пробовал, находится под парным и поэтому непригоден для любого полузатянувшегося прослушивания ...

В настоящее время я использую NaturalVoices от ATnT. Он доступен только для Windows (возможно, для Mac), но он работает под wine в Ubuntu .. (у него есть небольшой глют, где мне иногда нужно щелкнуть по панели, когда я ухожу от читателя ... Это незначительная проблема по сравнению с преимуществом, полученным качеством речи от NatualVoices.

Некоторые другие вещи, которые я нашел практически необходимыми для получувствительного прослушивания, - это ...

  1. Эти прогамы TTS не являются разумными (ну, может быть, такими же умными, как молодой бабуин). Поэтому им нужна каждая помощь, которую они могут получить. и есть одна (и только одна программа Reader , которую я нашел, которая очень помогает в этом .. Приложение называется ReadPlease (2003 Pro) ... Это позволяет вам специально модифицировать слова и группы слов для выражаться как вы хотят их ... Это отнюдь не идеально, но для меня это делало разницу между всем процессом, который можно было использовать и не использовать ...

  2. Речь в Natural Voices «хорошо», но это немного скучно. Есть и другие хорошие продукты, но они все для Windows, к сожалению) ..
    Это иногда поражает неожиданно ... но OMG, изначально это боль! .. так что # 2 - это * терпение ... и много обновлений вашего списка «специальных слов» ... Терпение, я имею в виду, что вы (я) фактически привыкли к речевым узорам моего конкретного бабуина :) ... и, кстати, у меня в настоящее время около 3000 слов, которые теперь звучат «Человеком» настолько, что я больше не съеживаюсь, когда я их слышу.

    3 .. «Следуйте за прыгающим мячом» ... Опять же, потому что голос никогда не бывает таким хорошим, как настоящий оратор, иногда нужно уточнять. Программа Reader, которую я использую, имеет одну функцию, для которой я даже встречаюсь с ее неуклюжим интерфейсом ... У меня есть опция «выбрать в настоящее время чтение». У многих читателей есть это, но ReadPlease держит текущую строку центр экрана. Это бесценно, чтобы иметь возможность видеть впереди и позади, чтобы быстро перечитать то, что вы только что пропустили (так что автоцентровка курсовой линии хорошая) ...

Хорошо, это мой опыт. Я собираюсь сделать кофе сейчас, и пока я это делаю, я буду слушать это, чтобы посмотреть, как он «читает» .... TTS удивительно хорош для сбора опечаток (я делаю много опечаток) ...

Если в репозитории Ubuntu появится что-то вроде ATnT NaturalVoices, я перейду к нему.

Вот ссылка на некоторые образцы естественных голосов : я использую «MIke»

    
ответ дан Peter.O 16.01.2011 в 16:07
3

SVOX pico2wave

это то, что я использую. И это звучит естественно, легко понять, он распознает единицы (м, ° С, кг, ...)

Вот мой первый пост для pico2wave

Натуральный звуковой текст для речи?

Все, что у вас есть, это:

Перейдите в Ubuntu Software Center и найдите "pico". Вы найдете 4 или 5 записей с помощью "Small Footprint Ling ...". Установите их.

Возможное использование pico2wave описано в моей первой публикации (следуйте по ссылке выше).

Bye     

ответ дан user85321 24.08.2012 в 17:36
2

Несмотря на то, что вы уже приняли ответ, я хотел упомянуть festival , что мне тоже очень нравится. Этот пост на форумах Ubuntu содержит много информации о том, как настроить очень хорошие голоса для него.

    
ответ дан frabjous 16.01.2011 в 15:55
0

Балаболка под Wine отлично работает (для меня) с голосами SAPI4 (голоса SAPI5 не обнаружены в моей Linux-системе). Он может открывать файлы и начинать чтение.

Вот ссылка на запись AppDB в Wine для Balabolka: Ссылка

    
ответ дан Hemantkumar Garach 04.01.2017 в 06:01
0

Установить: sudo apt-get install espeak Использование: echo [message] | espeak

    
ответ дан Consoli0 30.12.2017 в 18:39