Как извлечь изображения из файла Word?

Как извлечь из текстового документа .docx фотографии и сохранить их как отдельные файлы jpeg или bmp, используя имена из столбца Ф.И.О.?
  • 28 июня 2024 г. 12:52
Ответы на вопрос 2
Для извлечения изображений из файла Word (.docx) и сохранения их как отдельные файлы jpg или bmp, можно воспользоваться следующими шагами:

1. Откройте файл .docx в программе Microsoft Word.
2. Нажмите правой кнопкой мыши на изображении, которое вы хотите извлечь, и выберите "Сохранить как изображение".
3. Выберите формат файла (jpg или bmp) и укажите путь для сохранения изображения.
4. Повторите эти шаги для каждого изображения, которое вы хотите извлечь.

Чтобы извлечь изображения с учетом имен из столбца Ф.И.О., можно воспользоваться следующим скриптом на Python, который использует библиотеку python-docx для извлечения изображений:

```python
from docx import Document

doc = Document('your_document.docx')

for table in doc.tables:
    for row in table.rows:
        fio = row.cells[2].text # Предположим, что Ф.И.О. находится в третьем столбце таблицы
        for cell in row.cells:
            for paragraph in cell.paragraphs:
                for run in paragraph.runs:
                    if run.element.tag.endswith('}drawing'):
                        embedded = run._element.find('.//' '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}blip')
                        if embedded is not None:
                            image_id = embedded.get('{http://schemas.openxmlformats.org/officeDocument/2006/relationships}embed')
                            image_part = doc.part.related_parts[image_id]
                            image_bytes = image_part.blob
                            with open(fio + '.jpg', 'wb') as f:
                                f.write(image_bytes)
```

Этот скрипт будет извлекать изображения из документа .docx и сохранять их как отдельные файлы jpg с именами, соответствующими значениям из столбца Ф.И.О. в таблице. Пожалуйста, убедитесь, что у вас установлена библиотека python-docx перед запуском этого скрипта.
1. С помощью архиватора открыть docx и распаковать внутренний каталог word\media. 
2. В файловом менеджере, например, в Total commander или в командной строке, пакетно переименовать эти файлы, используя список из этого документа.
Единственное условие, в документе фотки должны были сохранены последовательно, так же как добавляли строки. Если порядок добавления строк был нарушен, то имена файлов изображений не будут в том же порядке, что и строки.
Похожие вопросы