Вы достигли предела
По курсу — карьерное препятствие
Что дальше?
Рубрика развивается при поддержке HP logo
Технологии
Ден Васильев
59 676

Как бесплатно перевести аудиозапись в текст (mp3 to Word)

На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.

В закладки

Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.

Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.

Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.

Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.

На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.

UPD 3.02.2019
3. В комментариях ещё порекомендовали данный сервис от Google:

При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.

Как не заводить много электропочт, создавая новый аккаунт, т.к. в существующем истёк trial, а отдавать почти 5 тысяч за платный не хочется? Возможно, вы об этом способе уже слышали. Допустим, у вас почта «mypochta2020@gmail.com», заводя новый аккаунт, в поле e-mail укажите «mypochta2020++@gmail.com». Письмо-подтверждение придёт на «mypochta2020@gmail.com». Насколько я знаю, кол-во плюсов может быть любым.

Используйте технологии XXI века для удобства и экономии времени!

{ "author_name": "Ден Васильев", "author_type": "self", "tags": [], "comments": 33, "likes": 21, "favorites": 113, "is_advertisement": false, "subsite_label": "tech", "id": 140340, "is_wide": false, "is_ugc": true, "date": "Sun, 02 Feb 2020 14:07:07 +0300", "is_special": false }
Создан для будущего Узнайте больше HP Neverstop Laser HP Neverstop Laser
Объявление на TJ Отключить рекламу
0
33 комментария
Популярные
По порядку
Написать комментарий...
18

Есть один специалист по переводу мп3 в текст

Ответить
0

ахахахахахахаха ЭКСПЕРТ!

Ответить
6

60 минут бесплатно, при первой регистрации на cloud дают 300$ на использование любого сервиса в том числе и speach-to-Text
https://cloud.google.com/speech-to-text

Ответить
–5

60 минут через гугл и 9 часов через указанный в статье сервис. Разница очевидна.

Ответить
7

60 минут в месяц бесплатно. 300 баксов дают при первой регистрации, тариф ($0.004 / 15 seconds), после 60 минут в месяц. И того 312.5 часов бесплатно, разница действительно очевидна. Я не эксперт, но что-то мне подсказывает, что все эти сервисы используют google,amazon,ibm и это в лучшем случаи и просто перепродают тебе.

Ответить
0

Да, действительно, вы правы. Гугл в таком случае выгоднее. Спасибо за информацию!

Ответить
0

я правильно понял, что для того, чтобы им воспользоваться, нужно создать проект, сервисный аккаунт, учетные данные (и т. д.?)?

Ответить
0

регистрация и добавить карту ввести данные, проверять их не будут в том плане, что высылать скан паспорта не надо , а дальше да проект получить ключ и дальше и тд. Сейчас дают 300 баксов на 3 месяца, а не на год уже.

Ответить
0

Ага, и еще, как выяснилось, нужна программа на питоне. Я не программист, нашел такую инструкцию, сделал всё по ней, но застопорился в этом месте, такую ошибку получаю:

NameError Traceback (most recent call last)
in ()
61 storage_client = storage.Client(project_id)
62 blobs = storage_client.list_blobs(bucket_name)
—-> 63 for blob in blobs:
64 print(blob.name)
65 list_blobs(bucket_name)

NameError: name 'blobs' is not defined

Ответить
3

"На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы"
Это же какое ЧСВ должно быть у тебя и у твоей мамы что бы такие подарки вообще дарить

Ответить
1

Лучший подарок для мамы - это ЖУРНАЛ, сделанный своими руками, но С ПОМОЩЬЮ бесплатной программы по переводу аудио в текст!
Капец, на дворе 21 век, а тут такое, ёперный театр!

Так, ладно, шутки шутками, но скоро 8 марта, пойду доделывать газету для мамы :)))))

Ответить
0

Классная ирония про газету)) В интернете, кстати, полно услуг по созданию именных журналов в подарок. Я делал всё сам, в т.ч. вёрстку, процесс от А до Я занял 3 недели. Если нет времени, можно отдать от 10 тыс. и выше, за вас всё сделают спец. фирмы)

Ответить
0

Уважаемый Андрей, попробуйте сделать данный подарок своей маме, жене или сестре. Именинница оценит. Вам вовсе не обязательно заказывать тираж 5 тыс. экземпляров, чтобы распространять его через магазины посторонним лицам. Достаточно одного. Таким образом ваше ЧСВ и ЧСВ вашего близкого останется на адекватном умеренном уровне.

Ответить
0

Я бы не оценила. Но у нас с вами разные представления о жизни и нашем месте в этом мире и жизни окружающих.

Ответить
3

🤦‍♀️

Ответить

Необходимый волк

0

Гугл переводчик

Ответить
3

Через гугл переводчик вы можете только наговорить текст. Загрузить аудиофайл для транскрибации невозможно.

Ответить
3

Комментарий удален по просьбе пользователя

Ответить

Будущий Даниль

Озорной
0

Можно так завести и в системную диктовку, которая будет работать прямо в Ворде и оффлайн, если это важно (на маке точно, на Win10 вроде тоже есть подобное)

Ответить
0

Согласна но там ограничение по символам, беда, Роман

Ответить
1

Осталось только теперь БЕСПЛАТНО раздобыть программу по переводу 4К видео в диафильмы и привет 19 век!

Ответить
0

Спасибо!
Не понимаю, почему с этим так тухло
Вот пара сервисов есть и хорошо
А софта оффлайн нормального нет

При том что сама технология в любом свежем андроиде есть

Ответить
0

беда лишь в том, что андроид ненужон

Ответить
0

Пользовался таким способом расшифровать текст: заходил в гугл переводчик, запускал распознавание текста по голосу и включал на фоне, собственно, сам файл. Там в настройках микшера немного надо повозиться, чтобы все работало, но это один из самых действенных и бесплатных способов расшифровать текст.

Ответить
0

Кстати. Для Клауд Спич Гугл сначала нужно скачать файл, а уже после загрузить его для обработки. Если файл весит много, а интернет не самый быстрый, то скачивание, а потом заливка в Клауд Спич Гугл - слишком долго. Да и в целом довольно нерационально сначала скачивать видео из интернета, а потом его обратно туда загружать.

В Тринт можно загрузить файл по прямой ссылке. Если надо расшифровать видео с известного хостинга, например, ютуба, я делаю так:
1. Копирую url нужного видео
2. Иду на savefrom, чтобы "выдернуть" прямую ссылку на видео
3. Иду на Тринт, там выбираю функцию "добавить через url"

Готово. Существенная экономия времени.

Ответить
0

Подскажитеплиз, как удалить карту с сайта trint.com? Есть только графа внесения новых данных карты, но мне оное не надо...

Ответить
0

Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема

Ответить
0

Имеет смысл добавить в список https://speechtext.ai Использую долгое время (поддерживает много языков, в том числе и русский). Неплохо справляется с разными типами аудио (интервью, видео). Цена в разы ниже, чем Sonix и HappyScribe (меньше чем 3$ за час, HappyScribe (~14$ за час), Sonix ($10 за час) ), а  функции по сути абсолютно такие же. Есть настройки доменного распознавания речи, отлично ловит доменную терминологию. По ощущениям точность где-то на уровне 80-90% для русского, но конечно зависит от качества записи.
Файлов я обрабатываю не так много, поэтому их персонального плана хватает чуть ли не на полгода. У того же HappyScribe по сути за 1 час аудио уходили эти деньги. На мой взгляд у Sonix, HappyScribe, Trint (там подписка выходит чуть ли не $500 в год) цена завышена.
Буду рад, если кому то моя ссылка помогла

Ответить
0

"не забудьте после транскрибации удалить её данные в Настройках" карта не удаляется, и что делать?

Ответить
0

Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема

Ответить
0

Thank you for ideas. I am transcriptionist and I used this software, Izitext.io .It's really helps me to transcribe the recorded audio. I recommend this tool for my fellow transcriptionist like me. 
Thank you! 

Ответить
0

А можно про Speech-to-Text поподробнее как пользоваться им в Google Cloud

Ответить
–2

В поиске по названию песни добавляешь лирикс или текст) и тебе гугл даст текст песен) или на оборотной стороне коробки от аудио кассеты или компакт диска)))

Ответить
Обсуждаемое
Спорт
Умер Диего Марадона
Ему было 60 лет.
Новости
«Проект»: в Петербурге живёт близкая подруга Путина с активами на $100 млн, её дочь «феноменально» похожа на президента
В университете Брэдфорда оценили сходство Путина и дочери Светланы Кривоногих в 70,44%.
Технологии
«Яндекс» представил колонку «Яндекс.Станция Макс» с мощным звуком, экраном и пультом. Что нового — в пяти впечатлениях
Поддержка 4K HDR и новый звук — не главное, всё меняет встроенный LED-экран.
Популярное за три дня
Истории
Серия самоубийств солдат за три недели: что происходит в Австралии после отчёта о преступлениях спецназа в Афганистане
Годами новобранцев учили убивать, заставляя тренироваться на пленных и гражданских. Теперь в стране намерены наказать виновных.
Интернет
Жюри школьной олимпиады по математике подсказало участникам неверные ответы на сайте с решениями домашних заданий
Списавшим можно только посочувствовать — скорее всего, их ждёт дисквалификация.
Истории
Как СССР хотел построить в Финляндии «демократическую республику», но лишь подтолкнул её к союзу с Третьим рейхом
Недооценка противника, пропагандистские мифы и геополитические просчёты сделали для Кремля сомнительной номинальную победу в полузабытой Зимней войне.
null