Какой набор компонентов следует выбрать для сборки сервера, предназначенного для работы с искусственным интеллектом?

Добрый день! <br/> Я работаю над проектом для группы из 5-10 человек и изучаю различные серверные решения, но пока не могу определиться с необходимым оборудованием. <br/> Мои задачи включают: <br/> - Анализ документов объемом от 10 до 50 (до 100) страниц в формате docx; <br/> - Документацию, анализ своей документации и предоставление информации по запросу; <br/> - Редактирование документов и создание новых на основе шаблонов, используя информацию из уже существующих документов. <br/> <br/> В настоящее время у меня нет необходимости в обработке изображений и видео. <br/> <br/> Я вижу множество платных сервисов, но не хочу передавать свои данные сторонним компаниям. Кроме того, мне кажется, что такие сервисы могут использовать ИИ за границей, что вызывает дополнительные сомнения. <br/> <br/> Возможно, кто-то из вас уже сталкивался с подобной ситуацией и может поделиться своим опытом? Или существует ли какая-то формула для расчета необходимых вычислительных мощностей? <br/> Спасибо!
  • 10 апреля 2025 г. 12:05
Ответы на вопрос 2
Добрый день!

Сборка сервера для задач, связанных с обработкой текстов и использованием искусственного интеллекта, требует сбалансированного подхода к выбору компонентов. Вот рекомендации по выбору оборудования, основываясь на ваших требованиях:

### 1. Процессор (CPU)
Для задач анализа и обработки текста важно иметь мощный процессор, особенно если вы планируете выполнять одновременные задачи для группы из 5-10 человек.
- **Рекомендации**: Intel Core i7/i9 или AMD Ryzen 7/9. Также можно рассмотреть серверные процессоры, такие как Intel Xeon или AMD EPYC, так как они обеспечивают лучшую многопоточность.

### 2. Оперативная память (RAM)
Обработка документов и работа с ИИ может требовать значительного количества оперативной памяти.
- **Рекомендации**: минимум 32 ГБ RAM, лучше 64 ГБ или больше, если бюджет позволяет.

### 3. Хранилище (SSD/HDD)
Для быстрой загрузки и доступа к документам предпочтительнее использовать SSD.
- **Рекомендации**: 1-2 ТБ NVMe SSD для ОС и программ, и дополнительно HDD для резервного хранения, если необходимо.

### 4. Видеокарта (GPU)
Если ваш проект в дальнейшем планирует использование глубокого обучения или выполнения задач, требующих значительных вычислительных ресурсов, то стоит рассмотреть видеокарту.
- **Рекомендации**: NVIDIA RTX 3060 или выше, если планируете использовать GPU для ИИ. Если GPU не будет использоваться, то его можно исключить.

### 5. Материнская плата
Выбор материнской платы зависит от вашего процессора и других компонентов.
- **Рекомендации**: выберите материнскую плату, которая поддерживает ваш процессор и имеет достаточно слотов для оперативной памяти и расширительных карт.

### 6. Блок питания
Убедитесь, что блок питания достаточно мощный и надежный.
- **Рекомендации**: 750 Вт и выше, в зависимости от выбранных компонентов.

### 7. Корпус
Корпус должен обеспечивать хорошую вентиляцию и доступ к компонентам.
- **Рекомендации**: придерживайтесь стандартного размера (ATX или Micro-ATX), чтобы обеспечить хорошую организованность.

### 8. Операционная система
Для работы с ИИ удобны Linux-дистрибутивы, такие как Ubuntu или CentOS, но и Windows также может быть подходящим, особенно если вы будете использовать специфические приложения.

### 9. Программное обеспечение
Не забывайте о необходимых библиотеках и инструментах для работы с ИИ, таких как TensorFlow, PyTorch и другие.

### Общие советы
- Если у вас есть возможность, протестируйте разные компоненты, чтобы оценить их производительность.
- Рассмотрите возможность использования облачных решений в случае временной нагрузки, но с учетом ваших соображений о конфиденциальности данных.

### Заключение
Ваши задачи могут требовать баланс между мощностью и ценой. Определение необходимой конфигурации зависит от специфики ваших вычислений и стиля работы. Удачи в сборке сервера! Если будут дополнительные вопросы, не стесняйтесь обращаться.
Если вариант 'только ИИ и никакими другими адекватными способами' уже решен и вас не перспорить то... 

Забудьте про анализ на процессоре, будете ждать часами документ . Вам нужна видеокарта, а точнее достаточный объем vram что бы вместить и веса сети (ориентируйтесь на исходные веса и 8бит квантизацию) и kv-cache для контекстного окна (а его объем значимый) и кеша желательно 4-х кратно, что бы batching работал лучше.

Адекватные серверные GPU купить в россии (да и не только) за адекватные деньги не возможно.

Адекватные деньги - это только десктопное железо, самое доступное это 4060ti 16gb vram (по 55т.р. они тормозные для игр поэтому и дешевые). В самом лучшем варианте их можно будет вставить 4шт (можно и больше но почти наверняка будут проблемы в других местах) и при этом работать они будут максимум pci-e 4x (это повлияет на время загрузки весов но не на их работу!)

Если готовы переплатить, берите любые nvidia с 24gb vram. В принципе будет работать и amd, но по софту будете ограничены только llama.cpp, а он с видеокартами не самый эффективный (он заточен на работу на процессоре, но зато лучше всех)

С двумя gpu например отлично работает 14b сеть qwen и qwen distiled r1, я пока еще не пробовал но 27b гугловская так же будет работать. С четырьмя gpu можно пробовать 70b модели (c 4бит квантизацией точно), что llama что qwen.
Похожие вопросы