Могут ли возникнуть проблемы, если одновременно читать и записывать значение переменной из разных потоков?

Question

Искандер

cpp

Могут ли возникнуть проблемы, если одновременно читать и записывать значение переменной из разных потоков?

В приведённом абстрактном примере кода:  
<pre><code class="cpp">#include &lt;iostream&gt;
#include &lt;thread&gt;

int main() {
    size_t i = 0;
    
    std::thread th(
        [&amp;i]() {
            while (i++ &lt; 1'000'000'000'000);
        }
    );
    
    for (size_t j = i; j &lt; 1'000'000'000'000; j = i) {
        if (j % 2) std::cout &lt;&lt; j &lt;&lt; '\n';
    }
    
    th.join();
    
    return 0;
}</code></pre>  

в одном потоке происходит изменение переменной, а в другом - её считывание. При этом других потоков нет. Какие последствия могут возникнуть из-за этой гонки данных, учитывая, что вопрос относится больше к простым типам, а не сложным классам?   

Хотя я осведомлён о существовании `std::atomic`, меня интересует более философский аспект: что на самом деле может произойти в данной ситуации? Мне кажется, что никаких серьезных проблем возникнуть не должно.

5 апреля 2025 г. 17:45

Ответы на вопрос 3

Похожие вопросы

Answer 1

Да, одновременный доступ к одной и той же переменной из разных потоков без синхронизации может вызвать проблемы, и эти проблемы могут быть довольно серьезными. Давайте рассмотрим, что именно может произойти и почему.

### Потенциальные проблемы:

1. **Гонки данных (Data Race)**: Когда два или более потоков обращаются к одной и той же переменной одновременно, и хотя бы один из потоков выполняет запись, это называется гонкой данных. В вашем случае, один поток увеличивает значение переменной `i`, а другой поток проверяет и выводит её значение. Это приводит к неопределённому поведению.

2. **Неопределённое поведение**: Без должной синхронизации поведение программы может быть непредсказуемым. Один поток может видеть устаревшее значение переменной или "половинчатые" изменения (например, когда значение `i` увеличивается, но ещё не записано обратно в память, и поток чтения продолжает видеть старое значение).

3. **Кэширование и оптимизации компилятора**: Неявное поведение также связано с тем, как данные кэшируются в CPU и оптимизируются компиляторами. Операции могут быть переупорядочены, и это может привести к тому, что поток, читающий переменную, увидит значения, которые физически не соответствуют хранимым в памяти.

4. **Проблемы с видимостью**: Один поток может не видеть изменения, внесенные другим потоком из-за кэширования на уровне CPU. Таким образом, если один поток изменил переменную, другой поток может продолжать работать с устаревшим значением.

### Примеры последствий:

- **Бесконечный цикл**: Если один поток читает значение `i` и видит его, скажем, равным 5, а другой поток увеличивает `i` таким образом, что он, например, застревает на значении 5 (поток записи может выйти в бесконечный цикл из-за ошибок синхронизации), то программа может застрять.

- **Программные ошибки**: Так как потоки могут работать с неконсистентными данными, вы можете получить неверные результаты при их использовании в логике программы, что может повлечь за собой логику программных ошибок, которые могут быть трудно найти и воспроизвести.

### Заключение:

Хотя вы правы в том, что простые типы данных, такие как `size_t`, могут вести себя иначе, чем более сложные структуры, все равно необходимо помнить о потенциальных гонках данных и необходимости синхронизации. Использование `std::atomic` в C++ позволяет избежать этих проблем, обеспечивая корректное поведение и гарантируя, что все потоки имеют доступ к актуальному и согласованному значению переменной. Не забывайте, что правильная синхронизация критична для безопасного многопоточского программирования.

Answer 2

Ничего страшного не произойдет, да. Просто вы никак не проконтролируете, когда запись из первого потока будет видна во втором потоке. Например, вы тут можете увидеть скачек сразу на 2, или несколько раз подряд одно и то же значение, хоть оно по идее должно постоянно и монотонно расти.

Answer 3

Сильно зависит от того, что такое size_t, но на распространённых платформах, где size_t совпадает с разрядностью машины, может или расти скачками, или вообще висеть в одном состоянии.