Когда нужна программа, а не бот

Telegram-бот или веб-сервис — быстрее и удобнее в 90% случаев. Программа выигрывает там, где есть конкретные ограничения.

NDA и конфиденциальность

Запись интервью под NDA, медицинская консультация, корпоративный созвон с цифрами — такие файлы нельзя загружать в облако даже с «гарантированным удалением». Локальная программа держит файл и текст только у вас на устройстве.

Большие объёмы и нет интернета

Журналист в командировке, исследователь в экспедиции, оператор на площадке без связи — им нужно расшифровывать прямо в ноут. Один раз поставил — всегда работает.

Регулярные большие объёмы

Если каждый день расшифровываете по несколько часов — подписка на любой облачный сервис со временем перевесит цену программы (или бесплатной open-source). Считайте на год вперёд.

Сравнение программ

Включили только программы, которые: 1) работают офлайн, 2) поддерживают русский, 3) живы и обновляются в 2026. Веб-сервисы, привязанные к облаку, в этом сравнении не участвуют.

Программа OS Цена Интерфейс Сложность Русский
Buzz
open-source
macOS, Windows, Linux Бесплатно Графический Низкая Да
Aiko
от разработчика Sindre Sorhus
macOS, iOS $25 разово Графический Минимальная Да
Vibe
open-source
macOS Бесплатно Графический Низкая Да
Subtitle Edit
open-source
Windows Бесплатно Графический (для субтитров) Средняя Да
VOSK
для разработчиков
macOS, Windows, Linux Бесплатно Командная строка Высокая Да
Под выбранный фильтр программ не нашлось.

Все программы по умолчанию работают офлайн на вашем устройстве. Точность распознавания у всех примерно одинаковая (используют близкие движки) — разница только в интерфейсе и удобстве.

Что ждать на этапе установки

Buzz и Vibe — самый простой случай

Скачать .dmg или .exe, перетащить в Программы, открыть. На первом запуске программа сама докачает «модель распознавания» (~1,5 ГБ). Дальше — перетаскиваете аудиофайл в окно программы, нажимаете «расшифровать». Время обработки часа аудио — от 5 минут на ноутбуке с дискретной видеокартой до 30–40 минут на обычном офисном.

Aiko — платно, но «просто работает»

Mac App Store, оплата $25 разово, всё. Никаких настроек, выбора моделей, подкачки файлов. Минус — только Mac/iPhone. Если вы давно в экосистеме Apple и не хотите ничего настраивать — это лучший вариант.

Subtitle Edit — для субтитров и тайм-кодов

Программа изначально для редактирования субтитров. Распознавание — одна из функций. Выгружает текст с тайм-кодами (важно для видео и YouTube). Интерфейс — олдскульный, но понятный.

VOSK — только если вы разработчик

Командная строка, Python, ручная настройка. Зато встраивается в любой пайплайн — у многих корпоративных систем расшифровки под капотом именно VOSK. Не для конечного пользователя.

Скриби-фенек
Скриби говорит Видеокарта — главный фактор скорости. На Mac M-серии обработка летает: час аудио за 3–5 минут. На офисном ноутбуке без видеокарты — 30–60 минут на тот же час.

Как выбрать под свою задачу

Альтернатива: облако без установки

Программа — это всегда: место на диске, обновления, опасность «не запустилась после нового обновления macOS». Если конфиденциальность не на первом месте, проще пользоваться Telegram-ботом: ничего ставить не нужно, работает с любого устройства, бесплатные 120 минут в месяц. Сравнение всех вариантов.

Если не хотите ничего ставить

Откройте чат с ботом и отправьте файл. 120 минут в месяц — бесплатно.

@scribi_ai_bot

Частые вопросы

Какая программа точнее: бесплатная или платная?

Точность одинаковая — все программы построены на близких open-source движках. Разница в интерфейсе, скорости и вспомогательных функциях. Если готовы потратить полчаса на настройку — выберете бесплатную.

Сколько весит модель распознавания?

От 200 МБ (легковесная, быстрая, менее точная) до 3 ГБ (большая, медленная, максимально точная). Большая часть программ скачивает «среднюю» модель ~1,5 ГБ — это разумный компромисс.

А есть программы для Android и iPhone?

Aiko есть на iOS. Для Android локальных программ с нормальной поддержкой русского пока нет — проще использовать Telegram-бот или встроенный диктофон с транскрибацией.

Программа делает разбивку по спикерам?

Из коробки — почти ни одна. Это отдельная задача, требующая дополнительных моделей. Если спикеры важны — проще использовать сервис или бот, где разбивка встроена.

Можно ли использовать программу для коммерческой расшифровки?

Open-source программы (Buzz, Vibe, Subtitle Edit, VOSK) лицензированы для любого использования, включая коммерческое. У Aiko — стандартная Mac App Store-лицензия. Сами тексты, которые вы получите — ваши.

Программа быстрее или медленнее облака?

На Mac M-серии — сравнимо с облаком. На обычном ноутбуке без дискретной видеокарты — раз в 5–10 медленнее: час аудио обрабатывается 30–60 минут.

Скриби

Не хотите ставить программу — используйте бот

Любое устройство, любой файл, без установки. 120 минут в месяц — бесплатно.

@scribi_ai_bot