На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы. Основой содержимого стали интервью с её близкими и друзьями. С ними я встречался лично, записывал разговор на диктофон. Дальше начиналось самое интересное. Эти записи предстояло расшифровать в текст.
Пять лет назад подобный подарок я уже делал, подруге. В 2015-м ещё не имелось достойных сервисов, способных транскрибировать аудиофайлы в текст. Сейчас технологии достигли необходимого уровня.
Делюсь подборкой соответствующих сервисов, наиболее совершенных. Trial-версия в каждом из них даёт обработать от 30 минут до 9 часов. Как правило, этого достаточно для большинства непромышленных задач. Экспорт готовой стенограммы возможен в Word и т.п. Если звук чёткий, без посторонних шумов, а люди говорят внятно, то качество расшифровки будет близко к 100%. В полученном документе останется лишь настроить стили и разбить его на абзацы.
Здесь можно бесплатно расшифровать три файла. При этом максимальная длина каждого – до трёх часов. Итого, 1 аккаунт = 9 бесплатных часов. Если у вас больше трёх файлов, но все они суммарно меньше 9-часового лимита, просто «склейте» их предварительно в аудиоредакторе. Тогда вам будет достаточно одной учётки. В противном случае на каждые три файла придётся регистрировать новый профиль.
Примечание. Во время регистрации нужно привязать банковскую карту. Если не планируете покупать платный тариф, не забудьте после транскрибации удалить её данные в Настройках. Тогда через 7 дней деньги не спишутся. Безлимитный тариф стоит от 75$ в месяц.
На каждом из этих сайтов бесплатно можно обработать запись до 30 минут. Принцип работы, и, судя по всему, движок, один и тот же. Тарифы не совсем прозрачные. В т.ч., поэтому первый сервис удобнее.
UPD 3.02.2019
3. В комментариях ещё порекомендовали данный сервис от Google:
При регистрации в любом из сервисов Google Cloud даётся 300$ на их использование (бесплатный trial). Этого хватит для перевода около 300 часов аудио в текст.
Как не заводить много электропочт, создавая новый аккаунт, т.к. в существующем истёк trial, а отдавать почти 5 тысяч за платный не хочется? Возможно, вы об этом способе уже слышали. Допустим, у вас почта «mypochta2020@gmail.com», заводя новый аккаунт, в поле e-mail укажите «mypochta2020++@gmail.com». Письмо-подтверждение придёт на «mypochta2020@gmail.com». Насколько я знаю, кол-во плюсов может быть любым.
Используйте технологии XXI века для удобства и экономии времени!
60 минут бесплатно, при первой регистрации на cloud дают 300$ на использование любого сервиса в том числе и speach-to-Text
https://cloud.google.com/speech-to-text
60 минут в месяц бесплатно. 300 баксов дают при первой регистрации, тариф ($0.004 / 15 seconds), после 60 минут в месяц. И того 312.5 часов бесплатно, разница действительно очевидна. Я не эксперт, но что-то мне подсказывает, что все эти сервисы используют google,amazon,ibm и это в лучшем случаи и просто перепродают тебе.
я правильно понял, что для того, чтобы им воспользоваться, нужно создать проект, сервисный аккаунт, учетные данные (и т. д.?)?
Ага, и еще, как выяснилось, нужна программа на питоне. Я не программист, нашел такую инструкцию, сделал всё по ней, но застопорился в этом месте, такую ошибку получаю:
NameError Traceback (most recent call last)
in ()
61 storage_client = storage.Client(project_id)
62 blobs = storage_client.list_blobs(bucket_name)
—-> 63 for blob in blobs:
64 print(blob.name)
65 list_blobs(bucket_name)
NameError: name 'blobs' is not defined
"На днях закончил работу над журналом, который готовил к 55-летнему юбилею мамы"
Это же какое ЧСВ должно быть у тебя и у твоей мамы что бы такие подарки вообще дарить
Лучший подарок для мамы - это ЖУРНАЛ, сделанный своими руками, но С ПОМОЩЬЮ бесплатной программы по переводу аудио в текст!
Капец, на дворе 21 век, а тут такое, ёперный театр!
Так, ладно, шутки шутками, но скоро 8 марта, пойду доделывать газету для мамы :)))))
Я бы не оценила. Но у нас с вами разные представления о жизни и нашем месте в этом мире и жизни окружающих.
Согласный волк
Можно так завести и в системную диктовку, которая будет работать прямо в Ворде и оффлайн, если это важно (на маке точно, на Win10 вроде тоже есть подобное)
Осталось только теперь БЕСПЛАТНО раздобыть программу по переводу 4К видео в диафильмы и привет 19 век!
Спасибо!
Не понимаю, почему с этим так тухло
Вот пара сервисов есть и хорошо
А софта оффлайн нормального нет
При том что сама технология в любом свежем андроиде есть
Пользовался таким способом расшифровать текст: заходил в гугл переводчик, запускал распознавание текста по голосу и включал на фоне, собственно, сам файл. Там в настройках микшера немного надо повозиться, чтобы все работало, но это один из самых действенных и бесплатных способов расшифровать текст.
Подскажитеплиз, как удалить карту с сайта trint.com? Есть только графа внесения новых данных карты, но мне оное не надо...
Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема
Имеет смысл добавить в список https://speechtext.ai Использую долгое время (поддерживает много языков, в том числе и русский). Неплохо справляется с разными типами аудио (интервью, видео). Цена в разы ниже, чем Sonix и HappyScribe (меньше чем 3$ за час, HappyScribe (~14$ за час), Sonix ($10 за час) ), а функции по сути абсолютно такие же. Есть настройки доменного распознавания речи, отлично ловит доменную терминологию. По ощущениям точность где-то на уровне 80-90% для русского, но конечно зависит от качества записи.
Файлов я обрабатываю не так много, поэтому их персонального плана хватает чуть ли не на полгода. У того же HappyScribe по сути за 1 час аудио уходили эти деньги. На мой взгляд у Sonix, HappyScribe, Trint (там подписка выходит чуть ли не $500 в год) цена завышена.
Буду рад, если кому то моя ссылка помогла
"не забудьте после транскрибации удалить её данные в Настройках" карта не удаляется, и что делать?
Подскажите пожалуйста, удалось удалить карту? у меня такая же проблема
Thank you for ideas. I am transcriptionist and I used this software, Izitext.io .It's really helps me to transcribe the recorded audio. I recommend this tool for my fellow transcriptionist like me.
Thank you!
А можно про Speech-to-Text поподробнее как пользоваться им в Google Cloud
В поиске по названию песни добавляешь лирикс или текст) и тебе гугл даст текст песен) или на оборотной стороне коробки от аудио кассеты или компакт диска)))
Комментарии