Распознавание речи MP3 в текст программного обеспечения [закрыт]

Question

Распознавание речи MP3 в текст программного обеспечения [закрыт]

Я ищу независимую от динамика программу (коммерческую или бесплатную), которая позволила бы мне транскрибировать MP3-файлы, содержащие речевые записи (особенно подкасты) в текст. Я хотел попробовать Дракон естественно говоря, но похоже, что он поддерживает только своим аудиозаписи. Итак, каковы альтернативы?

2

задан pako

03.01.2023 10:58

6 ответов

98	59	29	69	5	8	10	6	4	20

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя

Email

Похожие вопросы про тегам:

Уменьшите фоновый шум и оптимизируйте речь из аудиоклипа с помощью ffmpeg

score 7 · Answer 1

Дракон естественно говоря будет импортировать mp3 файлы и попытаться расшифровать их. Он предпочитает настраивать свое распознавание голоса на отдельный динамик, но делает справедливую работу без настройки. Вероятно, было бы лучше, если бы ваши динамики подкаста звучали как Том Брокоу.

score 4 · Answer 2

одним из возможных решений было бы загрузить видео на Youtube, и попробовать автоматические подписи, которые вы можете включить...это еще не слишком точно, но вы можете скачать файл субтитров и отредактировать его самостоятельно, если это помогает...Что касается вопросов авторского права/пиратства для песни, вы можете сделать видео частным в своем профиле, если это вообще возможно?

score 2 · Answer 3

Я бы предостерег от попыток Dragon естественно говоря-я написал несколько сценариев на моем взломанном iphone, чтобы скопировать / конвертировать все файлы голосовой почты с моего телефона в папку на моем компьютере, и Дракон естественно говоря служба транскрипции работать против них.

результат выполнения транскрипции для файлов с разными динамиками был абсолютно непригоден. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от динамика распознавание голоса по-прежнему ограничено очень маленькие словари.

score 1 · Answer 4

Я используюhttp://www.voicebase.com с подкаста и видео на английском языке, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.

вы можете скачать аудио транскрипцию на rtf, srt или pdf.

вы можете загрузить транскрипции машины около 10-15 минут после того как вы загружаете, и иногда, раньше.

score 1 · Answer 5

Open Source:CMU Sphinx

условно: http://www.e-speaking.com/ (с электроприводом)

реклама: Dragon NaturallySpeaking (Windows)

вы также можете попробовать этот метод, если вы пытаетесь с osx что можно сделать с помощью audacity и soundflower

вы также можете найти релевантные ссылки для opensource другой условно стоит попробовать было voxcribecc

Если вы программист .net вы могли бы использовать это метод сделать свой собственный комплект

score 0 · Answer 6

Podzinger было бы отличным решением, но я не уверен, что ramp (новое имя для компании, которая раньше EveryZing, которая производила Podzinger) предлагает услугу бесплатно...

http://en.wikipedia.org/wiki/Podzinger

Apple	$173,24	+0,81%
Amazon	$114,49	-1,94%
Microsoft	$325,19	+3,61%
Google	$123,44	+2,11%
Netflix	$364,74	-0,03%
Intel	$27,45	-5,34%
Facebook	$254,49	+2,11%
Tesla	$185,54	+1,44%
Tencent	$322,40	-3,01%