Как настроить голосовой ввод через микрофон в операционных системах Windows 10 или 11?

Как я могу настроить голосовой ввод текста на русском языке в операционной системе Windows 10 на ноутбуке?
  • 11 февраля 2024 г. 16:58
Ответы на вопрос 2
Для настройки голосового ввода на русском языке в Windows 10 вы можете использовать встроенные функции распознавания речи. Вот как это делается:

1. Подключите микрофон к вашему ноутбуку и убедитесь, что он работает корректно.

2. Откройте "Панель управления". Для этого введите "Панель управления" в поисковой строке рядом с кнопкой "Пуск" и выберите соответствующий результат.

3. В Панели управления перейдите в "Распознавание речи". Это можно сделать вручную, или введя "распознавание речи" в поиске на Панели управления.

4. Нажмите на "Начать обучение распознаванию голоса", чтобы настроить систему на ваш голос. Система проведет вас через процесс обучения, предложив прочитать несколько предложений.

5. Для изменения языка распознавания речи, вам нужно будет добавить поддержку русского языка. Перейдите в "Время и язык" в настройках (настройки можно открыть, нажав комбинацию клавиш Win + I), затем в раздел "Язык" и добавьте русский язык, если он не был добавлен ранее.

6. После добавления русского языка и установки его как основного, система распознавания речи будет использовать его для обработки вашего голосового ввода.

7. Вернитесь в "Распознавание речи" на Панели управления и включите "Распознавание речи Windows". Теперь вы можете использовать голосовой ввод там, где это возможно (например, в текстовых полях).

Кроме того, в Windows 10 вы можете использовать Cortana для голосовых команд и запросов, но возможности могут быть ограничены если ваш регион или язык не поддерживается.

В Windows 11 процесс настройки голосового ввода будет схожим, но интерфейсы и некоторые опции могут отличаться. Также стоит отметить, что распознавание речи в Windows может требовать подключения к интернету, поскольку некоторые функции используют облачные сервисы для улучшения качества распознавания.
Нет такого, и создание такой поддержки для windows очень не простое. Есть сторонние инструменты, но они еще более ограниченные. Эта область стагнировала годами, надеюсь нейронки трансформер вдохнут в нее жизни. 

Попробуй функционалом от гугл в google docs, чтобы оценить достоинства и недостатки. Так же при использовании google chrome можно включить подобный функционал простым плагином (я не нашел готового но раньше там достаточно было добавить атрибут x-webkit-speech к любому input и в нем появится кнопка голосового ввода, сейчас чуть чуть сложнее, в стандарте у браузера есть соответствующий api)

p.s. Интересно, сколько народ готов за подобный софт заплатить?
На основе открытых нейронных сетей типа whisper (там как я понял на код и веса очень удобная MIT) можно запилить вполне автономное приложение, а уж при наличии доступа к облачным api и подавно.

А вот на практике, все мои попытки лично пользоваться различными голосовыми набиралками и управлялками разбиваются о кучу неудобств, которые приходится постоянно обходить, они полностью убивают все бонусы...

В частных случаях возможно голосовой набор имеет смысл, но тогда зачем городить для этого поддержку ОС.
Похожие вопросы