Проблема классической расшифровки
Стандартный пайплайн журналиста образца 2020 года выглядел так: записать на диктофон, потом 4–5 часов сидеть с наушниками на скорости 0.7×, печатая каждое слово. На часовое интервью уходил полный рабочий день — только на расшифровку, до первой строчки текста статьи.
В 2026 это уже ненужное упражнение. Машины пишут текст не хуже младшего стажёра, причём за 3–5 минут на час записи. Освободившийся день — это два дополнительных интервью, либо одна нормально написанная статья.
Шаг 1. Запись — не экономьте
От качества записи зависит вся дальнейшая работа. Плохая запись — это плохой текст, нечёткое разделение спикеров и потерянные цитаты в местах, где «не разобрать».
Что использовать
- Диктофон — классика для офлайн-интервью. Положите между собой и собеседником, экраном вверх. Современный смартфон тоже сойдёт — микрофоны iPhone и флагманов Samsung лучше большинства бюджетных диктофонов.
- Запись звонка / Zoom — используйте встроенную функцию записи. Если нет — программы для захвата звука с экрана (OBS, Audio Hijack). Никогда не записывайте через громкую связь.
- Внешний микрофон — если интервью записывается для подкаста и будет публиковаться. Для «просто текстовой расшифровки» избыточно.
Чего избегать
- Громкой связи на телефоне.
- Помещений с эхом (стеклянных переговорок).
- Пересжатых файлов (Telegram-голосовое или WhatsApp пересылка).
- «Записать на часы» — микрофон у часов плохой, голос собеседника часто теряется.
Шаг 2. Текст с разбивкой по говорящим
Ключевое слово — «разбивка по говорящим». Без неё расшифровка интервью на двух людей превращается в кашу: непонятно, где ваш вопрос, а где ответ.
Большинство веб-сервисов даёт разбивку только за доплату. В Scribi она включена по умолчанию — даже на бесплатном тарифе. Текст возвращается примерно так:
Спикер 1: Расскажите, как вы пришли в эту индустрию. Спикер 2: На первый взгляд случайно. Я учился на физика, но на третьем курсе попал на стажировку в геологическую партию — и там понял, что экспедиции — это моё. Спикер 1: А что именно зацепило?
Бот не знает имён, но разделяет голоса по тональности. Вы сами поменяете «Спикер 1» на «Я» и «Спикер 2» на имя собеседника при поиск-замене.
Шаг 3. Извлечение цитат и тайм-кодов
Зачем нужны тайм-коды
Тайм-коды — ваша страховка. Если собеседник потом скажет «я такого не говорил» — у вас есть точное место в записи. Многие издания требуют тайм-коды как часть фактчекинга.
В Scribi на тарифах «Стандарт» и «Премиум» текст возвращается с тайм-кодами по абзацам:
[12:45] Спикер 2: Мы начали с двух человек в гараже. К концу первого года уже было сорок сотрудников.
Как извлекать цитаты
Прочитайте текст по диагонали
Не вчитывайтесь — ищите эмоциональные пики, цифры, истории, контр-интуитивные тезисы. Это и есть цитаты-кандидаты.
Сохраните 10–15 кандидатов
В отдельном документе. Не 5, а именно 10–15 — чтобы было из чего выбирать. В финальный материал войдёт 4–6.
Сверьте со звуком в спорных местах
Если цитата острая или цифра — переслушайте именно этот кусок по тайм-коду. Машина может ослышаться на именах и числах.
Сократите без искажения смысла
Цитаты в тексте обычно требуют редактуры — уберите паразиты, многословие. Главное правило: смысл сохраняется на 100 %, иначе это уже не цитата.
Расшифруйте интервью прямо сейчас
Кидай файл в Telegram-бот — получай текст с разбивкой по говорящим. 120 минут — бесплатно.
Шаг 4. Сборка черновика статьи
Когда у вас есть текст, разделённый по спикерам, цитаты с тайм-кодами и конспект (который Scribi возвращает автоматически) — материал собирается за 1.5–2 часа.
Шаблон материала из интервью
- Лид (3–5 строк). Кто собеседник, о чём говорили, главный тезис.
- Сильная цитата. Та, которая зацепит читателя в первом абзаце. Часто это что-то контр-интуитивное или эмоциональное.
- Контекст. Кто этот человек, почему его мнение важно.
- Основная часть. 4–6 ключевых мыслей, в каждой — цитата.
- Финал. Что дальше, на чём собеседник заканчивает.
Конспект, который вернул бот, — это уже готовая структура «4–6 ключевых мыслей». Вы только присваиваете каждой цитату из вашего списка кандидатов и добавляете контекст.
Этические нюансы
- Согласие на запись. Всегда спрашивайте перед началом, в идеале — зафиксируйте на записи: «вы не против, что я записываю?». Это и вежливость, и юридическая страховка.
- Off the record. Если собеседник просит «это не для печати» — уважайте. В расшифровке такое часто всплывает, помечайте такие места и удаляйте перед публикацией.
- Имена и факты. Машинная расшифровка может ошибиться в именах собственных и цифрах. Любую цитату с именем или числом сверяйте со звуком — это базовая гигиена факт-чекинга.
- Хранение записей. Спрашивайте у редакции, как долго хранить аудио и транскрипты. Обычно — до публикации + 6–12 месяцев на случай претензий.
Частые вопросы
А если интервью на английском или двуязычное?
Английский Scribi распознаёт нативно. Двуязычные интервью (русский+английский в одной записи) тоже работают — текст возвращается на двух языках в тех местах, где каждый звучал.
Как быть с конфиденциальными записями?
Аудиофайл удаляется сразу после расшифровки. Текст хранится только в вашем чате с ботом. Никто из команды Scribi не имеет доступа к истории. Для особо чувствительных интервью (адвокаты, источники) — рекомендуем локальный движок.
Можно ли получить SRT-файл для нарезки коротких видео?
Да, на тарифах «Стандарт» и «Премиум» доступен экспорт SRT — субтитры с точными тайм-кодами. Удобно для шортсов из интервью.
А что с записью в шумной обстановке (кафе, улица)?
Точность падает на 5–10 %. Имена и цифры всё равно нужно сверять со звуком. Совет: на улице держите телефон ближе ко рту собеседника, в кафе — подальше от кофемашины.
Сколько стоит для регулярной работы?
Если берёте 2–3 интервью в неделю по часу — это 8–12 часов в месяц. Полностью покрывается тарифом «Старт» за 199 ₽. Тариф «Стандарт» (599 ₽) даёт 60 часов — это объём целой редакции на 3–5 человек.
Записал — расшифровал — написал
Без ночных перепечаток. Час интервью — несколько минут в Telegram.
Открыть @scribi_ai_bot