Для поиска похожих названий на основе написания, а не смысла, можно использовать модель word2vec или модель эмбеддингов символов (character embeddings).
Модель word2vec представляет каждое слово в виде вектора, который учитывает его семантическое значение. Однако, если вы хотите найти похожие названия на основе написания, то модель word2vec может быть не самым лучшим выбором.
Вместо этого, вам может помочь модель эмбеддингов символов. Она представляет каждый символ слова в виде вектора. Используя эту модель, вы будете искать ближайшие названия на основе похожих символов, вместо их семантического значения. Примером такой модели является FastText.
Дополнительно, чтобы учитывать порядок символов, можно использовать рекуррентные нейронные сети (RNN), которые анализируют символы слова по одному, учитывая контекст и последовательность.
Когда вы получите эмбеддинги для каждого названия, вы можете использовать алгоритмы кластеризации (например, K-means) или поиск ближайших соседей (например, KD-деревья) для нахождения ближайших названий на основе векторного представления.