Для локальной обработки аудиофайлов с русским голосом существует несколько моделей, которые могут вам подойти. Вот некоторые из них:
1. **Vosk**: Эта библиотека открытого исходного кода поддерживает множество языков, включая русский. Вы можете использовать модели Vosk для распознавания речи, и их можно запустить на локальном оборудовании. Vosk также хорошо работает на GPU, так что ваш RTX 4090 будет вам полезен.
2. **DeepSpeech**: Это открытый проект от Mozilla, который также может поддерживать русский язык. Однако для достижения хороших результатов может понадобиться дообучение модели на ваших данных.
3. **Kaldi**: Это один из самых мощных инструментов для распознавания речи, который также поддерживает русский язык. Он требует серьезных знаний для настройки и запуска, но может быть очень эффективным.
4. **Silero Models**: Модели от исследования Silero могут использоваться для распознавания речи на русском языке и могут быть запущены локально. Они также достаточно легкие в использовании.
5. **askey.ai**: Эта новая модель от Яндекса также может быть использована для распознавания речи и поддерживает русский язык. Возможно, потребуется проверка на тему локального развертывания, так как информация может изменяться.
6. **Whisper от OpenAI**: Whisper — это мощная модель для распознавания речи, которая поддерживает множество языков. Вы можете попробовать скачать и использовать Whisper на своем компьютере, она может быть достаточно эффективной в плане качества распознавания.
Перед выбором модели рекомендуется протестировать каждую из них на небольшом объеме данных, чтобы понять, какая из моделей покажет лучшие результаты в ваших условиях.