Что такое расшифровка аудио

Расшифровка — превращение записи (голосового, лекции, интервью, звонка, подкаста) в письменный текст. В идеале — с абзацами, пунктуацией и разбивкой по говорящим. Слово «транскрибация» означает практически то же самое: разница — только в контексте употребления.

Расшифровать аудио в 2026 можно тремя путями: через веб-сервис, через программу-приложение или через бота в Telegram. Все три варианта работают на похожих движках распознавания, но удобство, цена и качество выгрузки сильно отличаются.

Сравнение 10 сервисов

Включите фильтр — и останутся только те варианты, которые подходят вам по ключевому критерию. Например, «бесплатно» + «без регистрации» = два варианта.

Сервис Тип Цена Язык Спикеры Размер файла
Scribi
@scribi_ai_bot
Telegram-бот 120 мин/мес бесплатно, далее от 199 ₽ Русский, EN, ещё ~70 Да До 2 ГБ
Otter.ai Веб + приложение 300 мин/мес бесплатно, далее $16,99/мес Англ. отлично, русский — слабо Да До 1,5 ГБ
Sonix Веб $10 за час аудио Русский — ок Да До 5 ГБ
Trint Веб $80/мес стартовый план Русский — средне Да До 3 ГБ
Rev.com Веб (AI + люди) $0,25/мин (AI), $1,99/мин (люди) В основном английский Да До 5 ГБ
Speechpad Веб (русский) Бесплатно (с ограничениями) Русский — ок Нет До 200 МБ
Яндекс SpeechKit Для разработчиков ~16 ₽/час Русский — отлично Да Без ограничений
Сбер SaluteSpeech Для разработчиков ~10 ₽/час Русский — отлично Да Без ограничений
Заметки iPhone Встроено в iOS Бесплатно Русский — ок (только живая речь) Нет Только в реальном времени
Локальные программы Установка на ПК Бесплатно Русский — ок Нет (без ручных настроек) Без ограничений
Под выбранный фильтр сервисов не нашлось.

Цены актуальны на апрель 2026, проверяйте на сайте сервиса. «Хорошо распознаёт русский» — субъективная оценка по тестам на записях с шумами и двумя спикерами.

Как выбрать под свой кейс

Простые правила, которые отсеивают 80% вариантов за минуту.

Если вы один пользователь, не разработчик

Telegram-бот — самый короткий путь. Не нужно ставить программы, регистрироваться, привязывать карту иностранного банка. Файл или голосовое в чат — через 3 минуты текст.

Если нужен русский в высоком качестве

Сильнее всего на русском работают движки от Яндекса и Сбера — но это интерфейсы для разработчиков, не для конечного пользователя. На их же движках работают Telegram-боты.

Если нужен английский и командная работа

Otter.ai остаётся стандартом: интеграция с Zoom и Google Meet, шеринг расшифровок коллегам, поиск по истории. На русском — слабее.

Если запись очень секретная

Локальные программы — единственный вариант, который не отправляет файл наружу. Но это требует установки, видеокарты и командной строки. Подробнее — в обзоре программ.

Если нужно расшифровать раз в месяц

Берите бесплатные планы. Scribi даёт 120 минут в месяц без карты, Otter.ai — 300 минут. Speechpad — без лимитов, но файл нужно резать на куски по 200 МБ.

Цены: сколько стоит расшифровать час аудио

Если привести все тарифы к одной величине — стоимости часа аудио — разброс получается в десятки раз.

Стоимость 1 часа аудио (₽)

Scribi (тариф «Старт») ~13 ₽
Сбер SaluteSpeech ~10 ₽
Яндекс SpeechKit ~16 ₽
Sonix ~900 ₽
Otter.ai (Pro) ~150 ₽
Rev.com (AI) ~1 400 ₽
Фрилансер на бирже 6 000 ₽

Сервисы для разработчиков (Сбер, Яндекс) самые дешёвые в пересчёте — но их нельзя использовать как конечный пользователь без программирования. Telegram-боты строятся на них же и добавляют сверху минимальную наценку за удобство и разбивку по спикерам.

Скриби-фенек
Скриби говорит Не ведитесь на «$10 за час, в долларах звучит дёшево». Считайте в рублях и на ваш реальный объём в месяц. Час в месяц = 199 ₽ против 900 ₽ ощутимо.

Пощупайте на своей записи

120 минут — бесплатно, без карты. Просто отправьте файл или голосовое.

@scribi_ai_bot

Ошибки при выборе сервиса

  1. Смотреть только на цену за минуту. «5 ₽/мин» звучит дёшево, но на 5-часовом интервью — это уже 1 500 ₽. У тарифного сервиса с абонкой выходит дешевле, если объём регулярный.
  2. Игнорировать язык. Сервис может прекрасно работать на английском и валиться на русском. Перед оплатой — тестовый файл с вашей речью.
  3. Не проверять разбивку по спикерам. Многие сервисы возвращают сплошной текст без «— Спикер 1: …». Для интервью и круглых столов это критично.
  4. Не учитывать лимит на файл. 3-часовая лекция в MP3 может весить 200–300 МБ. Сервис с лимитом 100 МБ вы не используете без нарезки.
  5. Платить за «человеческую» расшифровку, когда хватает машинной. Rev.com и биржи — это 60–120 ₽ за минуту, а точность машинной расшифровки в 2026 уже на уровне 92–95%.

Частые вопросы

Какой сервис лучший в 2026 для русского языка?

В пересчёте на конечного пользователя — Telegram-боты на движках Яндекса и Сбера. Для разработчиков, которые встраивают расшифровку в свой продукт — напрямую SpeechKit или SaluteSpeech.

Сколько стоит расшифровка одного часа аудио?

От 0 ₽ (бесплатные планы и локальные программы) до 6 000 ₽ (фрилансер на бирже). У Telegram-ботов — 13–25 ₽ при месячной подписке.

Что точнее: автоматическая расшифровка или человек?

На чистой записи (один спикер, без шума) машина в 2026 уже точнее: 95–97% против 90–93% у человека. На грязной записи (улица, перебивания) — человек пока обгоняет.

Какие форматы поддерживают сервисы?

Стандарт — MP3, WAV, M4A, OGG. Видеоформаты (MP4, MOV) поддерживают примерно половина. Подробно — в гайде по форматам.

Расшифровка через бота — это безопасно?

Файл уходит на сервер сервиса для распознавания и там же удаляется. Если запись с NDA — смотрите локальные программы, у них всё происходит на вашем устройстве.

Можно ли расшифровать запись с диктофона телефона?

Да, любой современный сервис принимает запись с диктофона iOS/Android. Главное — не пересжимать перед отправкой: оригинал из «Диктофона» в разы лучше, чем тот же файл, прокачанный через мессенджер.

Скриби

Расшифруйте свою запись прямо в Telegram

Без регистрации, без карты, на русском — из коробки. 120 минут в месяц — бесплатно.

@scribi_ai_bot