Приложение для распознавания речи для преобразования MP3 в текст?

21

Кто-нибудь знает о приложении, которое может конвертировать аудио в текст? Я запускаю ubuntu 12.04 LTS.

    
задан Kopano 09.07.2012 в 13:33
источник

4 ответа

15

Программное обеспечение, которое вы можете использовать, - CMUSphinx. В отличие от предложенного в другом ответе, Julius не подходит, потому что он требует моделей. Модели для большого распознавания речи в словарях недоступны для Julius.

Вы можете использовать pocketsphinx для преобразования аудиофайла. Эти две команды должны выполнять эту работу. Сначала вы конвертируете файл в требуемый формат, а затем узнаете его:

ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav

Запуск pocketsphinx

pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > result.txt

Результат будет сохранен в файле result.txt.

    
ответ дан Nikolay Shmyrev 20.02.2014 в 21:24
9

Я хочу конвертировать речь в текст, вы можете попробовать открыть свой программный центр Ubuntu и искать Юлий

Описание

  

«Юлиус» - это высокопроизводительное двухпроходное программное обеспечение для декодирования непрерывного распознавания речи (LVCSR) с двумя проходами для исследователей и разработчиков, связанных с речью.

Или другой параметр, отсутствующий в Центре программного обеспечения, Саймон

  

... - программа распознавания речи с открытым исходным кодом и заменяет мышь и клавиатуру.

Ссылки

Ссылка

Ссылка

Ссылка

    
ответ дан CoalaWeb 09.07.2012 в 13:54
8

Я знаю, что это старо, но для того, чтобы расширить ответ Николая и, надеюсь, сохранить кого-то в будущем, чтобы получить обновленную версию работы pocketsphinx, вам нужно скомпилировать ее из репозитория github или sourceforge (не уверен, что поддерживается более актуально). Обратите внимание: -j8 означает, что, если это возможно, запускается 8 отдельных заданий; если у вас больше ядер процессора, вы можете увеличить число.

git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..

Затем из: Ссылка загрузите новейшие версии cmusphinx-en-us-....tar.gz и en-70k-....lm.gz

tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz

Затем вы можете, наконец, выполнить шаги из ответа Николая:

ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
    -hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
    2>pocketsphinx.log >book.txt

Сфинкс работает хорошо. Я бы не стал полагаться на него, чтобы сделать читаемую версию текста, но это достаточно хорошо, что вы можете искать его, если ищете определенную цитату. Это работает особенно хорошо, если вы используете алгоритм поиска, такой как Xapian ( Ссылка ), который принимает подстановочные знаки и не требует точных поисковых выражений.

Надеюсь, что это поможет.

    
ответ дан Jonathan Perry-Houts 25.04.2017 в 07:01
1
ответ дан alexei 10.07.2016 в 22:37