Яндекс знает, что Алиса не является моделью GPT?

Использует ли ЯндексGPT 2 модель, разработанную разработчиками GPT, или они разработали свою уникальную модель машинного обучения для создания Алисы под псевдонимом ЯндексGPT2?
  • 29 июля 2024 г. 16:43
Ответы на вопрос 2
Яндекс не использует модель GPT 2 для создания своего голосового помощника Алисы. Они разработали свою уникальную модель машинного обучения под псевдонимом ЯндексGPT2, которая специально адаптирована для работы с русским языком и его особенностями. Таким образом, Алиса не является просто копией модели GPT 2, а уникальным продуктом компании Яндекс.
Яндекс не вкладывает значительных денег в генеративные модели (я не видел от них таких утверждений но зато смотрел презентации где все было вокруг экономии на всем), полагаю по техническим причинам, денег у компании на порядок меньше чем у лидеров рынка, а в GPT, к сожалению, это напрямую определяет качество модели. 

Поэтому, они скорее всего, используют комплексный подход, улучшая слабую модель дополнительными меанизмами, такими как RAG и возможно еще кучей всего... нет нужды тратить ресурсы на обучение модели знаниями, по уму нужно ухватить только то что обучит ее логике и мышлению, а нужные данные можно подсунуть в контекст на ходу.

Этот подход позволяет использовать очень слабые модели как справочник, но все недостатки вылезают когда нужно 'по рассуждать'.
Похожие вопросы