Здравствуйте!
Для сравнения двух столбцов в DataFrame с использованием библиотеки Pandas вы можете воспользоваться простым сравнениями с помощью оператора `==`. Давайте разберем ваш вопрос по шагам.
1. **Сравнение двух столбцов**: Предположим, что у вас есть два столбца, которые вы хотите сравнить, и они находятся в отдельных DataFrame.
2. **Создание нового столбца**: Вы можете создать новый столбец, который будет содержать результат сравнения (True/False).
3. **Фильтрация строк**: Чтобы исключить числовые данные из результата, вы можете воспользоваться методом `apply` для фильтрации.
Вот пример кода, который иллюстрирует все эти шаги:
```python
import pandas as pd
# Загрузка данных
df_kw = pd.read_excel(r'C:\Users\Bot\Desktop\файлик.xlsx', header=1, skiprows=4)
df_orig = pd.read_excel(r'C:\Users\Bot\Desktop\ключевики.xlsx')
# Предположим, что нужные столбцы называются 'Column1' и 'Column2'
# Сравниваем два столбца
# Здесь я предполагаю, что вы хотите сравнить значения двух столбцов по индексу.
df_kw['Comparison'] = df_kw['Column1'] == df_orig['Column2']
# Сохранение результата в новый DataFrame
df_result = df_kw.copy()
# Фильтрация для значений False и исключение числовых значений
df_false = df_result[df_result['Comparison'] == False]
df_false_filtered = df_false[~df_false['Column1'].apply(lambda x: str(x).isdigit())]
# Сохранение итоговых данных в новый Excel файл
df_false_filtered.to_excel(r'C:\Users\Bot\Desktop\результаты.xlsx', index=False)
print("Сравнение завершено и результаты сохранены.")
```
### Объяснение:
- Загрузка данных из Excel происходит с помощью `pd.read_excel()`.
- В новом столбце `Comparison` записывается результат сравнения значений из `Column1` и `Column2`. Если они равны, записывается `True`, если нет — `False`.
- Затем создается новый DataFrame `df_false`, который содержит только те строки, где `Comparison` равно `False`.
- После этого фильтруем `df_false`, исключая строки с числовыми значениями (используя `apply` и `str.isdigit()`).
- Наконец, сохраняем отфильтрованные данные в новый файл Excel.
Убедитесь, что вы заменили `'Column1'` и `'Column2'` на реальные названия столбцов в ваших DataFrame. Надеюсь, это поможет вам в вашей задаче!