Video Transcriber: локальная транскрипция видео

Обзор

Утилита для расшифровки видео в текст без облачных сервисов: записи не уходят с машины, работает на обычной домашней видеокарте. Задача была простая - пакетно транскрибировать накопившиеся видео локально. Внутри faster-whisper с CTranslate2 для GPU-ускоренного распознавания, пакетная обработка и кэширование моделей.

Ключевые возможности

Локальная обработка: данные не уходят с машины
GPU-ускорение: заточено под NVIDIA с 8+ ГБ VRAM
Пакетный режим: glob-паттерны по каталогам
Кэширование моделей: одна загрузка в models/
Выбор модели и compute type для баланса скорости/точности

Технический стек

Язык: Python
ASR: faster-whisper, CTranslate2
Аудио: FFmpeg для извлечения дорожки
Окружение: Docker (NVIDIA CUDA base)