6 типов записей и что с ними делать

1. Диктофонная запись

Запись из «Диктофона» на iPhone, Android или отдельного устройства Sony/Olympus/Zoom. Формат: M4A, MP3, WAV. Подход самый простой: файл переносится на компьютер или сразу шарится в Telegram — и уходит в бот. Подробнее — в гайде по расшифровке диктофона.

2. Запись с телефона (звонок, конференция)

Звонок записывается приложением для записи звонков (CallRecorder, ACR). Файл MP3 или M4A — работает как обычная аудиозапись. Особенность: на звонках обычно несколько говорящих, важна разбивка по спикерам.

3. Видеозапись встречи (Zoom, Meet, Teams)

MP4 или M4A из истории встреч. Видео грузить не обязательно — если есть отдельный аудиотрек, лучше отправить именно его. Файл будет легче и обработается быстрее. Подробно — в гайде по расшифровке видео.

4. Голосовое сообщение

Telegram, WhatsApp, iMessage, Viber. Самый частый кейс. Telegram-бот принимает голосовые напрямую через пересылку. Из других мессенджеров — через «Поделиться» в Telegram. Подробнее — в гайде по голосовым.

5. Скринкаст или экранная запись

QuickTime на Mac, OBS на Windows, встроенная запись iOS/Android. Технически это MP4, обрабатывается как любое видео — ничего особенного.

6. Скачанный подкаст или аудиокнига

MP3 / M4A / OGG. Студийное качество — лучший случай для распознавания: точность близка к идеальной. Если нужны цитаты, шоу-ноты или посты по эпизоду — смотрите гайд по подкастам.

Сколько времени занимает каждый

Все цифры — примерно: реальное время зависит от нагрузки сервиса и вашего интернета. Сравнение даёт ощущение порядка.

Время от «отправил» до «получил текст»

Голосовое 2 мин 5–15 сек
Голосовое 15 мин ~30 сек
Подкаст 30 мин (MP3) ~1.5 мин
Запись звонка 45 мин ~2.5 мин
Лекция 60 мин (M4A) ~3 мин
Zoom-встреча 90 мин (MP4) ~5 мин
Видео-лекция 2 часа ~7 мин
Аудиокнига 4 часа ~15 мин

Зелёным выделены варианты, где текст приходит за секунды — подходящие для «в потоке работы». Остальные обрабатываются в фоне: можно отправить файл и вернуться к нему через несколько минут.

Куда отправлять каждый тип

Скриби-фенек
Скриби говорит Если есть отдельный аудиотрек — всегда отправляйте его, не видео. Файл будет в 5–10 раз меньше, обработается быстрее, а распознавание точно такое же — текст ведь делается из звука.

Что улучшит результат

Совет 1

Отправляйте оригинал, не пересжатую копию. Каждая пересылка через WhatsApp/iMessage режет битрейт. Если есть исходный файл с диктофона — отправляйте его, не «фотку» аудио из соцсети.

Совет 2

Имена и термины запишите отдельно. Распознавание иногда «креативит» с именами собственными и аббревиатурами. После расшифровки — глобальный «Найти и заменить» по списку.

Совет 3

Несколько спикеров — расскажите боту. В настройках бота можно явно указать «несколько говорящих» — это улучшает разбивку.

Через бот — один интерфейс на всё

Откройте @scribi_ai_bot

Один раз нажмите «Старт» и закрепите чат. Дальше всё через пересылку.

Отправьте запись

Файл, голосовое, ссылка YouTube — любой формат. Бот сам разберётся, что это.

Получите текст

Короткое — за секунды. Длинное — за несколько минут. Бот пишет статус.

120 минут в месяц — бесплатно

Хватит на средний месяц студента, журналиста или контент-менеджера. Лимит обнуляется первого числа.

Любая запись — в один чат

Диктофон, голосовое, видео, скринкаст. 120 минут — бесплатно.

@scribi_ai_bot

Частые вопросы

Какой максимальный размер файла?

2 ГБ — это лимит самого Telegram на документ. По длительности — до 10–12 часов на один файл. Если ваша запись больше — разделите на части.

Какие форматы принимает бот?

Аудио: MP3, M4A, OGG, WAV, OPUS, FLAC. Видео: MP4, MOV, MKV, WEBM, AVI. Бот сам извлекает звуковую дорожку из видео.

Что делать, если запись содержит NDA-материал?

Не используйте облачные сервисы. Поставьте локальную программу: Buzz, Vibe или Aiko. Запись и текст останутся только на вашем устройстве.

Можно ли расшифровать запись на иностранном языке?

Да, поддерживается 50+ языков. Язык определяется автоматически. На записи со смесью языков — тоже распознаёт, но качество немного снижается.

Сколько хранится текст в боте?

Расшифровка остаётся в вашем чате с ботом столько, сколько вы её там не удалите. Сами файлы (отправленные вами и временные) удаляются с серверов сразу после обработки.

Получу ли разбивку по говорящим?

Да, на всех записях с несколькими голосами. Бот определяет говорящих автоматически. На коротких голосовых от одного человека разбивка не нужна и не применяется.

Скриби-фенек, слушает

Любая запись — любая длина — один бот

Откройте чат, отправьте файл — получите текст. 120 минут в месяц бесплатно.

@scribi_ai_bot