본문으로 건너뛰기
Previous
Next
C++ Atomic Operations | '원자적 연산' 가이드

C++ Atomic Operations | '원자적 연산' 가이드

C++ Atomic Operations | '원자적 연산' 가이드

이 글의 핵심

C++ std::atomic과 원자적 연산으로 멀티스레드에서 데이터 경쟁을 막는 방법. 뮤텍스 대비 장점과 실전 코드 패턴을 설명합니다.

원자적 연산이란?

원자적 연산 (Atomic Operation)분할 불가능한 연산으로, 중간 상태가 관찰되지 않습니다. 멀티스레드 환경에서 데이터 경쟁을 방지합니다.

#include <atomic>

std::atomic<int> counter{0};

// 원자적 증가
counter++;  // 스레드 안전

// 비원자적
int counter2 = 0;
counter2++;  // 스레드 안전하지 않음

왜 필요한가?:

  • 스레드 안전: 데이터 경쟁 방지
  • 성능: 뮤텍스보다 빠름
  • Lock-Free: 데드락 없음
  • 동기화: 메모리 순서 보장
// ❌ 비원자적: 경쟁 조건
int counter = 0;

void increment() {
    counter++;  // 1. load, 2. add, 3. store (3단계)
}

// Thread 1: load(0) -> add(1) -> store(1)
// Thread 2: load(0) -> add(1) -> store(1)
// 결과: 1 (예상: 2)

// ✅ 원자적: 안전
std::atomic<int> counter{0};

void increment() {
    counter++;  // 원자적 (1단계)
}

// Thread 1, 2 모두 안전하게 증가
// 결과: 2

원자적 연산 동작 원리:

다음은 mermaid 예제 코드입니다.

flowchart TD
    A[Thread 1: counter++] --> B{원자적?}
    B -->|Yes| C[하드웨어 원자적 명령]
    B -->|No| D[1. load]
    D --> E[2. add]
    E --> F[3. store]
    C --> G[완료]
    F --> H{Thread 2 개입?}
    H -->|Yes| I[경쟁 조건]
    H -->|No| G

원자적 연산 vs 뮤텍스:

특징std::atomicstd::mutex
성능빠름느림
복잡도낮음 (단순 연산)높음 (복잡한 연산)
Lock-Free✅ 가능❌ 불가
데드락❌ 없음✅ 가능
사용 사례카운터, 플래그복잡한 자료구조

C/C++ 예제 코드입니다.

// atomic: 단순 연산
std::atomic<int> counter{0};
counter++;

// mutex: 복잡한 연산
std::mutex mtx;
std::map<int, int> data;

{
    std::lock_guard lock(mtx);
    data[key] = value;
}

std::atomic

C/C++ 예제 코드입니다.

std::atomic<int> x{0};
std::atomic<bool> flag{false};
std::atomic<double> d{0.0};

// 기본 연산
x.store(10);
int value = x.load();
x.exchange(20);

실전 예시

예시 1: 카운터

#include <atomic>
#include <thread>
#include <vector>

std::atomic<int> counter{0};

void increment() {
    for (int i = 0; i < 1000; i++) {
        counter++;  // 원자적
    }
}

int main() {
    std::vector<std::thread> threads;
    
    for (int i = 0; i < 10; i++) {
        threads.emplace_back(increment);
    }
    
    for (auto& t : threads) {
        t.join();
    }
    
    std::cout << counter << std::endl;  // 10000
}

예시 2: 플래그

std::atomic<bool> done{false};

// Thread 1
void worker() {
    // 작업 수행
    done.store(true);
}

// Thread 2
void monitor() {
    while (!done.load()) {
        std::this_thread::sleep_for(std::chrono::milliseconds(100));
    }
    std::cout << "완료" << std::endl;
}

예시 3: CAS (Compare-And-Swap)

std::atomic<int> value{0};

void update() {
    int expected = 0;
    int desired = 10;
    
    // expected == value면 desired로 변경
    if (value.compare_exchange_strong(expected, desired)) {
        std::cout << "성공" << std::endl;
    } else {
        std::cout << "실패: " << expected << std::endl;
    }
}

예시 4: Lock-Free 스택

template<typename T>
class LockFreeStack {
    struct Node {
        T data;
        Node* next;
    };
    
    std::atomic<Node*> head{nullptr};
    
public:
    void push(T value) {
        Node* newNode = new Node{value, head.load()};
        
        while (!head.compare_exchange_weak(newNode->next, newNode)) {
            // 재시도
        }
    }
    
    bool pop(T& result) {
        Node* oldHead = head.load();
        
        while (oldHead && 
               !head.compare_exchange_weak(oldHead, oldHead->next)) {
            // 재시도
        }
        
        if (oldHead) {
            result = oldHead->data;
            delete oldHead;
            return true;
        }
        return false;
    }
};

atomic 연산

C/C++ 예제 코드입니다.

std::atomic<int> x{0};

// 읽기/쓰기
x.store(10);
int value = x.load();

// 교환
int old = x.exchange(20);

// CAS
int expected = 10;
x.compare_exchange_strong(expected, 20);

// 산술
x.fetch_add(5);
x.fetch_sub(3);
x++;
x--;

자주 발생하는 문제

문제 1: 비원자적 연산

C/C++ 예제 코드입니다.

std::atomic<int> x{0};

// ❌ 비원자적
x = x + 1;  // load + add + store (3단계)

// ✅ 원자적
x++;
x.fetch_add(1);

문제 2: ABA 문제

// A -> B -> A 변경 탐지 못함
std::atomic<Node*> head;

Node* oldHead = head.load();
// 다른 스레드: A -> B -> A
head.compare_exchange_strong(oldHead, newNode);  // 성공 (문제)

// ✅ 버전 카운터 추가
struct Pointer {
    Node* ptr;
    size_t version;
};
std::atomic<Pointer> head;

문제 3: 메모리 순서

C/C++ 예제 코드입니다.

// ❌ relaxed (순서 보장 안됨)
data.store(42, std::memory_order_relaxed);
ready.store(true, std::memory_order_relaxed);

// ✅ acquire-release
data.store(42, std::memory_order_relaxed);
ready.store(true, std::memory_order_release);

문제 4: 크기 제한

// ✅ lock-free 확인
std::atomic<int> x;
if (x.is_lock_free()) {
    std::cout << "Lock-free" << std::endl;
}

// 큰 타입은 lock-free 아닐 수 있음
struct Large { int data[100]; };
std::atomic<Large> large;  // lock-free 아닐 수 있음

lock-free 프로그래밍

C/C++ 예제 코드입니다.

// 장점: 락 없음, 빠름
// 단점: 복잡함, 디버깅 어려움

// 간단한 경우만 사용
std::atomic<int> counter;  // OK

// 복잡하면 mutex
std::mutex mtx;
std::map<int, int> data;  // mutex로 보호

실무 패턴

패턴 1: 스핀락

#include <atomic>
#include <thread>

class SpinLock {
    std::atomic<bool> flag_{false};
    
public:
    void lock() {
        while (flag_.exchange(true, std::memory_order_acquire)) {
            // 스핀
            std::this_thread::yield();
        }
    }
    
    void unlock() {
        flag_.store(false, std::memory_order_release);
    }
};

// 사용
SpinLock spinlock;

void criticalSection() {
    spinlock.lock();
    // 임계 영역
    spinlock.unlock();
}

패턴 2: 싱글톤 (Double-Checked Locking)

#include <atomic>
#include <mutex>

class Singleton {
    static std::atomic<Singleton*> instance_;
    static std::mutex mutex_;
    
    Singleton() = default;
    
public:
    static Singleton* getInstance() {
        Singleton* tmp = instance_.load(std::memory_order_acquire);
        
        if (tmp == nullptr) {
            std::lock_guard lock(mutex_);
            tmp = instance_.load(std::memory_order_relaxed);
            
            if (tmp == nullptr) {
                tmp = new Singleton();
                instance_.store(tmp, std::memory_order_release);
            }
        }
        
        return tmp;
    }
};

std::atomic<Singleton*> Singleton::instance_{nullptr};
std::mutex Singleton::mutex_;

패턴 3: 작업 큐

#include <atomic>
#include <queue>
#include <mutex>

template<typename T>
class WorkQueue {
    std::queue<T> queue_;
    std::mutex mutex_;
    std::atomic<size_t> size_{0};
    
public:
    void push(T item) {
        {
            std::lock_guard lock(mutex_);
            queue_.push(std::move(item));
        }
        size_.fetch_add(1, std::memory_order_release);
    }
    
    bool pop(T& item) {
        if (size_.load(std::memory_order_acquire) == 0) {
            return false;
        }
        
        std::lock_guard lock(mutex_);
        if (queue_.empty()) {
            return false;
        }
        
        item = std::move(queue_.front());
        queue_.pop();
        size_.fetch_sub(1, std::memory_order_release);
        return true;
    }
    
    size_t size() const {
        return size_.load(std::memory_order_acquire);
    }
};

FAQ

Q1: atomic은 언제 사용하나요?

A:

  • 카운터: 스레드 안전한 증가/감소
  • 플래그: 스레드 간 상태 공유
  • Lock-Free 자료구조: 고성능 동기화
std::atomic<int> counter{0};
std::atomic<bool> done{false};

Q2: 성능은?

A:

  • Lock-Free: 뮤텍스보다 빠름
  • 복잡한 타입: 느릴 수 있음 (lock 사용)
// lock-free 확인
std::atomic<int> x;
if (x.is_lock_free()) {
    std::cout << "빠름\n";
}

Q3: 메모리 순서는?

A:

  • relaxed: 빠름, 순서 보장 없음
  • acquire/release: 일반적, 순서 보장
  • seq_cst: 안전, 느림 (기본값)

C/C++ 예제 코드입니다.

// relaxed: 빠름
x.store(42, std::memory_order_relaxed);

// acquire/release: 일반적
x.store(42, std::memory_order_release);
int v = x.load(std::memory_order_acquire);

// seq_cst: 안전 (기본)
x.store(42);

Q4: CAS는 무엇인가요?

A: Compare-And-Swap으로, compare_exchange를 사용합니다. Lock-Free 프로그래밍의 핵심입니다.

std::atomic<int> value{0};

int expected = 0;
int desired = 10;

if (value.compare_exchange_strong(expected, desired)) {
    std::cout << "성공\n";
}

Q5: ABA 문제는?

A: A → B → A 변경을 탐지 못하는 문제입니다. 버전 카운터로 해결합니다.

struct Pointer {
    Node* ptr;
    size_t version;
};

std::atomic<Pointer> head;

Q6: atomic과 volatile의 차이는?

A:

  • atomic: 스레드 안전, 원자적 연산
  • volatile: 최적화 방지, 스레드 안전하지 않음

C/C++ 예제 코드입니다.

// ❌ volatile: 스레드 안전하지 않음
volatile int counter = 0;
counter++;  // 경쟁 조건

// ✅ atomic: 스레드 안전
std::atomic<int> counter{0};
counter++;  // 원자적

Q7: 모든 타입을 atomic으로 만들 수 있나요?

A: 작은 타입만 lock-free입니다. 큰 타입은 내부적으로 lock을 사용할 수 있습니다.

std::atomic<int> x;  // lock-free
std::atomic<std::string> s;  // lock-free 아닐 수 있음

// 확인
if (x.is_lock_free()) {
    std::cout << "Lock-free\n";
}

Q8: atomic 학습 리소스는?

A:

  • “C++ Concurrency in Action” by Anthony Williams
  • “The Art of Multiprocessor Programming” by Maurice Herlihy
  • cppreference.com - Atomic

관련 글: mutex, lock-free, memory-order.

한 줄 요약: 원자적 연산은 분할 불가능한 연산으로, 멀티스레드 환경에서 데이터 경쟁을 방지합니다.


같이 보면 좋은 글 (내부 링크)

이 주제와 연결되는 다른 글입니다.

관련 글

심화 부록: 구현·운영 관점

이 부록은 앞선 본문에서 다룬 주제(「C++ Atomic Operations | ‘원자적 연산’ 가이드」)를 구현·런타임·운영 관점에서 다시 압축합니다. 도메인별 세부 구현은 글마다 다르지만, 입력 검증 → 핵심 연산 → 부작용(I/O·네트워크·동시성) → 관측의 흐름으로 장애를 나누면 원인 추적이 빨라집니다.

내부 동작과 핵심 메커니즘

flowchart TD
  A[입력·요청·이벤트] --> B[파싱·검증·디코딩]
  B --> C[핵심 연산·상태 전이]
  C --> D[부작용: I/O·네트워크·동시성]
  D --> E[결과·관측·저장]
sequenceDiagram
  participant C as 클라이언트/호출자
  participant B as 경계(런타임·게이트웨이·프로세스)
  participant D as 의존성(API·DB·큐·파일)
  C->>B: 요청/이벤트
  B->>D: 조회·쓰기·RPC
  D-->>B: 지연·부분 실패·재시도 가능
  B-->>C: 응답 또는 오류(코드·상관 ID)
  • 불변 조건(Invariant): 버퍼 경계, 프로토콜 상태, 트랜잭션 격리, FD 상한 등 단계별로 문장으로 적어 두면 디버깅 비용이 줄어듭니다.
  • 결정성: 순수 층과 시간·네트워크·스케줄에 의존하는 층을 분리해야 테스트와 장애 분석이 쉬워집니다.
  • 경계 비용: 직렬화, 인코딩, syscall 횟수, 락 경합, 할당·GC, 캐시 미스를 의심 목록에 둡니다.
  • 백프레셔: 생산자가 소비자보다 빠를 때 버퍼·큐·스트림에서 속도를 줄이는 신호를 어디에 둘지 정의합니다.

프로덕션 운영 패턴

영역운영 관점 질문
관측성요청 단위 상관 ID, 에러율·지연 p95/p99, 의존성 타임아웃·재시도가 대시보드에 보이는가
안전성입력 검증·권한·비밀·감사 로그가 코드 경로마다 일관적인가
신뢰성재시도는 멱등 연산에만 적용되는가, 서킷 브레이커·백오프·DLQ가 있는가
성능캐시·배치 크기·커넥션 풀·인덱스·백프레셔가 데이터 규모에 맞는가
배포롤백 룬북, 카나리/블루그린, 마이그레이션·피처 플래그가 문서화되어 있는가
용량피크 트래픽·디스크·FD·스레드 풀 상한을 주기적으로 검증하는가

스테이징은 데이터 양·네트워크 RTT·동시성을 프로덕션에 가깝게 맞출수록 재현율이 올라갑니다.

확장 예시: 엔드투엔드 미니 시나리오

앞선 본문 주제(「C++ Atomic Operations | ‘원자적 연산’ 가이드」)를 배포·운영 흐름에 맞춰 옮긴 체크리스트입니다. 도메인에 맞게 단계 이름만 바꿔 적용할 수 있습니다.

  1. 입력 계약 고정: 스키마·버전·최대 페이로드·타임아웃·에러 코드를 경계에 둔다.
  2. 핵심 경로 계측: 요청 ID, 단계별 지연, 외부 호출 결과 코드를 로그·메트릭·트레이스에서 한 흐름으로 본다.
  3. 실패 주입: 의존성 타임아웃·5xx·부분 데이터·락 대기를 스테이징에서 재현한다.
  4. 호환·롤백: 설정/마이그레이션/클라이언트 버전을 되돌릴 수 있는지 확인한다.
  5. 부하 후 검증: 피크 대비 p95/p99, 에러율, 리소스 상한, 알림 임계값을 점검한다.
handle(request):
  ctx = newCorrelationId()
  validated = validateSchema(request)
  authorize(validated, ctx)
  result = domainCore(validated)
  persistOrEmit(result, idempotentKey)
  recordMetrics(ctx, latency, outcome)
  return result

문제 해결(Troubleshooting)

증상가능 원인조치
간헐적 실패레이스, 타임아웃, 외부 의존성, DNS최소 재현 스크립트, 분산 트레이스·로그 상관관계, 재시도·서킷 설정 점검
성능 저하N+1, 동기 I/O, 락 경합, 과도한 직렬화, 캐시 미스프로파일러·APM으로 핫스팟 확인 후 한 가지씩 제거
메모리 증가캐시 무제한, 구독/리스너 누수, 대용량 버퍼, 커넥션 미반납상한·TTL·힙/FD 스냅샷 비교
빌드·배포만 실패환경 변수, 권한, 플랫폼 차이, lockfileCI 로그와 로컬 diff, 런타임·이미지 버전 핀
설정 불일치프로필·시크릿·기본값, 리전스키마 검증된 설정 단일 소스와 배포 매트릭스 표준화
데이터 불일치비멱등 재시도, 부분 쓰기, 캐시 무효화 누락멱등 키·아웃박스·트랜잭션 경계 재검토

권장 순서: (1) 최소 재현 (2) 최근 변경 범위 축소 (3) 환경·의존성 차이 (4) 관측으로 가설 검증 (5) 수정 후 회귀·부하 테스트.

배포 전에는 git addgit commitgit pushnpm run deploy 순서를 권장합니다.


이 글에서 다루는 키워드 (관련 검색어)

C++, atomic, lock-free, C++11, concurrency 등으로 검색하시면 이 글이 도움이 됩니다.