Как загрузить изображения, используя список ссылок и указанные имена файлов?

Как можно преобразовать таблицу Excel следующего формата: <br/> name  | link <br/> n123   | <a href="http://lnk/photo1.jpg" rel="nofollow">lnk/photo1.jpg</a> <br/> n456   | <a href="http://lnk/photo2.jpg" rel="nofollow">lnk/photo2.jpg</a> <br/> n789   | <a href="http://lnk/photo3.jpg" rel="nofollow">lnk/photo3.jpg</a> <br/> так, чтобы на выходе получить следующие результаты: <br/> n123.jpg <br/> n456.jpg <br/> n789.jpg?
  • 20 сентября 2024 г. 18:43
Ответы на вопрос 2
Для преобразования таблицы Excel с указанными ссылками и именами файлов в желаемый формат (например, `n123.jpg`, `n456.jpg`, `n789.jpg`) вы можете воспользоваться несколькими шагами. Вот общий алгоритм, который вы можете использовать:

1. **Экспорт таблицы Excel в формат CSV** (если это еще не сделано):
   - Откройте вашу таблицу в Excel.
   - Сохраните ее в формате CSV (Файл -> Сохранить как -> запись формата CSV).

2. **Обработка CSV файла в Python** (или любом другом подходящем языке программирования):
   Если вы используете Python, вам потребуется библиотека `pandas`, чтобы упростить работу с данными. Вот пример кода:

   ```python
   import pandas as pd

   # Загрузка данных из CSV файла
   df = pd.read_csv('your_file.csv')

   # Предполагаем, что в df два столбца: 'name' и 'link'
   # Оставляем только нужный столбец 'name' и добавляем расширение '.jpg'
   df['new_filename'] = df['name'] + '.jpg'

   # Сохранение нового списка имен файлов в CSV (или другом формате)
   df[['new_filename']].to_csv('output_file.csv', index=False, header=False)

   print(df['new_filename'].tolist())
   ```

3. **Результат**: После выполнения скрипта вы получите новый CSV файл или список с именами файлов:
   ```
   n123.jpg
   n456.jpg
   n789.jpg
   ```

Этот процесс позволяет автоматически извлекать имена из ваших ссылок и формировать новые имена файлов с необходимым расширением. В случае использования других языков программирования (например, JavaScript, R и т.д.) принцип останется тем же: прочитать файл, извлечь нужные данные и записать их в новый формат.
Допустим (если нет заголовков) 
pip install pandas openpyxl

import pandas as pd
import os

def parse_excel(file_path):
    # Read the Excel file
    df = pd.read_excel(file_path, header=None)

    # Loop through each row in the DataFrame
    for index, row in df.iterrows():
        name = row[0]
        link = row[1]

        # Extract the file extension from the link
        file_extension = os.path.splitext(link)[1]  # Get the extension, e.g., .jpg

        # Form the new filename
        new_filename = f"{name}{file_extension}"

        # Output the new filename
        print(new_filename)


# Example usage
parse_excel("test.xlsx")
Похожие вопросы