Для использования Named Entity Recognition (NER) в PDF-файле вы можете использовать библиотеку Python PyPDF2 или textract для извлечения текстового содержимого из PDF. Затем вы можете применить NER-модель, такую как SpaCy, к извлеченному тексту, чтобы найти слова, которые находятся рядом с определенным объектом Word. Пример использования SpaCy для NER: 1. Установите SpaCy, загрузите соответствующую NER-модель и преобразуйте текстовый контент из PDF-файла в формат, поддерживаемый SpaCy: ```python import spacy nlp = spacy.load("en_core_web_sm") # Получение текстового содержимого из PDF файла (используйте PyPDF2 или textract) text = "Ваш текст из PDF" # Преобразование текста в формат SpaCy doc = nlp(text) ``` 2. Используйте метод `ents` для извлечения именованных сущностей из документа: ```python for entity in doc.ents: print(entity.text, entity.label_) ``` Этот код выведет все найденные именованные сущности и их метки. Вы можете модифицировать код, чтобы фильтровать только нужные метки или выполнить дополнительные операции с найденными сущностями. Относительно распознавания строк с фигурными скобками в файле, который изначально был в формате docx, вы можете использовать библиотеку python-docx, чтобы извлечь текст из документа и применить соответствующий регулярный выражение для поиска строк с фигурными скобками. Пример использования python-docx: ```python from docx import Document doc = Document('ваш_файл.docx') # Извлечение текста из документа all_text = [] for para in doc.paragraphs: all_text.append(para.text) # Применение регулярного выражения для поиска строк с фигурными скобками import re pattern = r'{.*?}' bracketed_strings = re.findall(pattern, ' '.join(all_text)) # Добавление найденных строк с фигурными скобками в список или файл # например: with open('bracketed_strings.txt', 'w') as f: for string in bracketed_strings: f.write(string + '\n') ``` Теперь у вас есть список строк с фигурными скобками, которые вы можете выполнить дополнительные операции или сохранить в другом файле. Однако, если в вашем документе имеются скрытые строки с фигурными скобками или особый форматирование, может потребоваться дополнительная обработка текста. Надеюсь, эти советы помогут вам в вашем проекте!