Яндекс не вкладывает значительных денег в генеративные модели (я не видел от них таких утверждений но зато смотрел презентации где все было вокруг экономии на всем), полагаю по техническим причинам, денег у компании на порядок меньше чем у лидеров рынка, а в GPT, к сожалению, это напрямую определяет качество модели.
Поэтому, они скорее всего, используют комплексный подход, улучшая слабую модель дополнительными меанизмами, такими как RAG и возможно еще кучей всего... нет нужды тратить ресурсы на обучение модели знаниями, по уму нужно ухватить только то что обучит ее логике и мышлению, а нужные данные можно подсунуть в контекст на ходу.
Этот подход позволяет использовать очень слабые модели как справочник, но все недостатки вылезают когда нужно 'по рассуждать'.