Я ищу независимую от динамика программу (коммерческую или бесплатную), которая позволила бы мне транскрибировать MP3-файлы, содержащие речевые записи (особенно подкасты) в текст. Я хотел попробовать Дракон естественно говоря, но похоже, что он поддерживает только своим аудиозаписи. Итак, каковы альтернативы?
Распознавание речи MP3 в текст программного обеспечения [закрыт]
6 ответов
Дракон естественно говоря будет импортировать mp3 файлы и попытаться расшифровать их. Он предпочитает настраивать свое распознавание голоса на отдельный динамик, но делает справедливую работу без настройки. Вероятно, было бы лучше, если бы ваши динамики подкаста звучали как Том Брокоу.
одним из возможных решений было бы загрузить видео на Youtube, и попробовать автоматические подписи, которые вы можете включить...это еще не слишком точно, но вы можете скачать файл субтитров и отредактировать его самостоятельно, если это помогает...Что касается вопросов авторского права/пиратства для песни, вы можете сделать видео частным в своем профиле, если это вообще возможно?
Я бы предостерег от попыток Dragon естественно говоря-я написал несколько сценариев на моем взломанном iphone, чтобы скопировать / конвертировать все файлы голосовой почты с моего телефона в папку на моем компьютере, и Дракон естественно говоря служба транскрипции работать против них.
результат выполнения транскрипции для файлов с разными динамиками был абсолютно непригоден. Я пробовал некоторые альтернативы с открытым исходным кодом, но независимое от динамика распознавание голоса по-прежнему ограничено очень маленькие словари.
Я используюhttp://www.voicebase.com с подкаста и видео на английском языке, и это работает очень хорошо. Это бесплатно в течение 50 часов аудио.
вы можете скачать аудио транскрипцию на rtf, srt или pdf.
вы можете загрузить транскрипции машины около 10-15 минут после того как вы загружаете, и иногда, раньше.
Open Source:CMU Sphinx
условно: http://www.e-speaking.com/ (с электроприводом)
реклама: Dragon NaturallySpeaking (Windows)
вы также можете попробовать этот метод, если вы пытаетесь с osx что можно сделать с помощью audacity и soundflower
вы также можете найти релевантные ссылки для opensource другой условно стоит попробовать было voxcribecc
Если вы программист .net вы могли бы использовать это метод сделать свой собственный комплект
Podzinger было бы отличным решением, но я не уверен, что ramp (новое имя для компании, которая раньше EveryZing, которая производила Podzinger) предлагает услугу бесплатно...
Постоянная ссылка на данную страницу: [ Скопировать ссылку | Сгенерировать QR-код ]