Распознавание речи MP3 в текст программного обеспечения [закрыт]

Я ищу независимую от динамика программу (коммерческую или бесплатную), которая позволила бы мне транскрибировать MP3-файлы, содержащие речевые записи (особенно подкасты) в текст. Я хотел попробовать Дракон естественно говоря, но похоже, что он поддерживает только своим аудиозаписи. Итак, каковы альтернативы?

2
задан pako
03.01.2023 10:58 Количество просмотров материала 3464
Распечатать страницу

6 ответов

Дракон естественно говоря будет импортировать mp3 файлы и попытаться расшифровать их. Он предпочитает настраивать свое распознавание голоса на отдельный динамик, но делает справедливую работу без настройки. Вероятно, было бы лучше, если бы ваши динамики подкаста звучали как Том Брокоу.

7
отвечен moioci 2023-01-04 18:46

одним из возможных решений было бы загрузить видео на Youtube, и попробовать автоматические подписи, которые вы можете включить...это еще не слишком точно, но вы можете скачать файл субтитров и отредактировать его самостоятельно, если это помогает...Что касается вопросов авторского права/пиратства для песни, вы можете сделать видео частным в своем профиле, если это вообще возможно?

4
отвечен studiohack 2023-01-04 21:03

Я бы предостерег от попыток Dragon естественно говоря-я написал несколько сценариев на моем взломанном iphone, чтобы скопировать / конвертировать все файлы голосовой почты с моего телефона в папку на моем компьютере, и Дракон естественно говоря служба транскрипции работать против них.

результат выполнения транскрипции для файлов с разными динамиками был абсолютно непригоден. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от динамика распознавание голоса по-прежнему ограничено очень маленькие словари.

2
отвечен nvuono 2023-01-04 23:20

Я используюhttp://www.voicebase.com с подкаста и видео на английском языке, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.

вы можете скачать аудио транскрипцию на rtf, srt или pdf.

вы можете загрузить транскрипции машины около 10-15 минут после того как вы загружаете, и иногда, раньше.

1
отвечен Juan Antonio Tubío 2023-01-05 01:37

Open Source:CMU Sphinx

условно: http://www.e-speaking.com/ (с электроприводом)

реклама: Dragon NaturallySpeaking (Windows)

вы также можете попробовать этот метод, если вы пытаетесь с osx что можно сделать с помощью audacity и soundflower

вы также можете найти релевантные ссылки для opensource другой условно стоит попробовать было voxcribecc

Если вы программист .net вы могли бы использовать это метод сделать свой собственный комплект

1
отвечен BlueBerry - Vignesh4303 2023-01-05 03:54

Podzinger было бы отличным решением, но я не уверен, что ramp (новое имя для компании, которая раньше EveryZing, которая производила Podzinger) предлагает услугу бесплатно...

http://en.wikipedia.org/wiki/Podzinger

0
отвечен Zach 2023-01-05 06:11

Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]

Ваш ответ

Опубликуйте как Гость или авторизуйтесь

Имя
Вверх