Как подсчитать количество вхождений определенной строки в таблицу данных (dataframe)?

Каким образом можно оптимизировать вычисление доли строк, удовлетворяющих определенному условию, в датафрейме, отличный от использования следующего кода? <code class="python">len(df) / len(df[cond])</code>
  • 21 мая 2024 г. 15:30
Ответы на вопрос 2
Для подсчета количества вхождений определенной строки в таблице данных (dataframe) можно использовать метод `str.contains()` в комбинации с методом `sum()`. Например:

```python
count = df['column_name'].str.contains('specific_string').sum()
print(count)
```

Для оптимизации вычисления доли строк, удовлетворяющих определенному условию, можно использовать метод `count()` в комбинации с методом `query()`. Например:

```python
total_count = len(df)
condition_count = df.query('condition')['column_name'].count()
ratio = total_count / condition_count
print(ratio)
```

Этот способ является более эффективным, так как он избегает создания дополнительного датафрейма и повторного вычисления длины.
Вроде 

df[cond].mean()
Похожие вопросы