Почему при преобразовании из формата csv в json пропадает первая строка?

Question

Джексон

pandas

Почему при преобразовании из формата csv в json пропадает первая строка?

13 августа 2023 г. 8:26

Ответы на вопрос 3

Похожие вопросы

Answer 1

При преобразовании из формата csv в json с помощью функции `to_json` в pandas, пропадает первая строка, потому что в функции `readCsv` используется метод `df[df.name.str.contains(search, regex=True, flags=re.IGNORECASE)]` для фильтрации данных по определенному критерию. 

Этот метод возвращает только строки, в которых значение столбца "name" содержит указанную строку. В результате, если первая строка не удовлетворяет условию фильтрации, она не будет включена в итоговый результат.

Для исправления этой проблемы можно изменить метод фильтрации данных, чтобы он включал первую строку. Например, можно изменить метод `readCsv` следующим образом:

```python
def readCsv(option, search):
    df = pd.read_csv(f'{option}.csv')
    df.columns = ["name", "image", "link", "price", "discount"]
    res = df[df.name.str.contains(search, regex=True, flags=re.IGNORECASE) | (df.index == 0)]
    res['name'] = df['name'].str.partition('[')[0]
    return res.sort_values(by='price', ascending=True)
```

В этом случае, если первая строка не удовлетворяет условию фильтрации, она будет включена в итоговый результат.

Answer 2

Возможно, есть параметр, который позволяет удалить заголовок файла.

Answer 3

Предлагается использовать параметр "header", чтобы указать номер строки, которую нужно использовать в качестве заголовка колонок. При использовании значения по умолчанию (header='infer'), заголовок будет выводиться на основе первой строки файла. Если вы явно указываете имена колонок при помощи параметра "header", то вам необходимо установить header=None. Если вам нужно заменить существующий заголовок, вы можете передать значение header=0. Также, вы можете создать мультииндекс на колонках, передав список индексов строк для заголовка, например, [0, 1, 3]. Промежуточные строки, которые не указаны в списке, будут пропущены. Обратите внимание, что параметр не учитывает комментарии и пустые строки, если skip_blank_lines=True, поэтому header=0 обозначает первую строку данных, а не первую строку файла. Документация находится по ссылке: https://pandas.pydata.org/docs/reference/api/panda...