Как выполнить текстовую многоэтапную проверку с помощью инструмента LLama3?

Каким образом реализовать систему классификации чисел, полученных из анализируемых PDF-файлов с помощью модели на LLama3? Желаем провести централизованную классификацию чисел по разным категориям (задолженности, пени, госпошлины), процедурам (Возврат, Взыскание), и статусу удовлетворения (Полностью, Частично). Каким образом закодировать результаты классификации для последующего добавления их в базу данных? Мы планируем осуществить трехэтапную проверку через модель, и необходим хронологический порядок действий в рамках этого процесса.
  • 15 июля 2024 г. 19:22
Ответы на вопрос 2
Для выполнения текстовой многоэтапной проверки с помощью инструмента LLama3, следуйте следующим шагам:

1. Подготовьте текстовые данные для анализа, например, извлеките числа из анализируемых PDF-файлов.

2. Загрузите текстовые данные в LLama3 и создайте модель для классификации чисел по заданым категориям (задолженности, пени, госпошлины) и процедурам (Возврат, Взыскание) с учетом статуса удовлетворения (Полностью, Частично).

3. Обучите модель на подготовленных данных, чтобы она могла классифицировать числа в соответствии с заданными категориями.

4. После завершения классификации чисел, закодируйте результаты для последующего добавления их в базу данных. Например, вы можете использовать числовые коды для каждой категории или процедуры.

Что касается трехэтапной проверки через модель, в рамках процесса выполнения текстовой многоэтапной проверки, следуйте следующему хронологическому порядку действий:

1. Подготовьте данные для анализа и извлеките числа из PDF-файлов.
2. Загрузите данные в LLama3 и создайте и обучите модель классификации чисел по заданным категориям и процедурам.
3. Проведите классификацию чисел согласно требуемым категориям и процедурам.
4. Закодируйте результаты классификации для добавления их в базу данных.

Следуя этим шагам и хронологическому порядку действий, вы сможете успешно выполнить текстовую многоэтапную проверку с использованием инструмента LLama3 и осуществить централизованную классификацию чисел из анализируемых PDF-файлов.
Скорее всего выбранный инструмент подходит для задачи слабо. У llama3 выполнение инструкций на уровне 60%-70% , т.е. треть данных она будет пропускать или ещё хуже, выдумывать. 

У llama3-70b (именно ее качество такое высокое, у 8b оно заметно ниже) есть ещё беда, она может ответ дать в случайном виде, не машиночитаемом, хоть и вернвм, а значит для чтения потребуется городить многоуровневую систему из того же ИИ и ручного распознавания.

Скорее всего твоя задача лучше решается предварительным анализом классическими алгоритмами.

И ещё момент, локальные сети эффективнее использовать, дообучая на своих запросах и данных (сотни и тысячи примеров), так полученная сеть будет лучше давать результат но ценой уменьшения универсальности.
Похожие вопросы