본문으로 건너뛰기
Previous
Next
BFS와 DFS | 그래프 탐색 알고리즘 완벽 정리 | 핵심 개념과 실전 활용

BFS와 DFS | 그래프 탐색 알고리즘 완벽 정리 | 핵심 개념과 실전 활용

BFS와 DFS | 그래프 탐색 알고리즘 완벽 정리 | 핵심 개념과 실전 활용

이 글의 핵심

BFS와 DFS: 그래프 탐색 알고리즘 BFS (너비 우선 탐색)·DFS (깊이 우선 탐색).

시리즈 안내

#10 | 📋 전체 목차 | 이전: #09 이진 탐색 · 다음: #11 백트래킹


들어가며

”그래프 탐색의 양대 산맥”

BFS와 DFS는 그래프/트리 탐색의 기본입니다. 코딩 테스트에서 매우 자주 나오므로 반드시 마스터해야 합니다.

코딩 테스트 준비하며 깨달은 것

알고리즘 문제를 풀다 보면 “이게 실무에 무슨 도움이 될까?” 하는 의문이 들 때가 있습니다. 저도 그랬습니다. 하지만 실제 프로젝트에서 성능 문제에 부딪히면, 알고리즘 지식이 얼마나 중요한지 깨닫게 됩니다. 예를 들어, 사용자 검색 기능이 느려서 고민하다가 해시 테이블을 적용하니 응답 시간이 10초에서 0.1초로 줄어든 경험이 있습니다. 코딩 테스트는 단순히 취업을 위한 관문이 아니라, 문제 해결 능력을 키우는 훈련장입니다. 처음엔 브루트 포스로 풀다가, 시간 복잡도를 개선하는 과정에서 “아, 이렇게 생각하면 되는구나” 하는 깨달음을 얻을 때의 쾌감은 말로 표현하기 어렵습니다. 이 글에서는 단순히 정답 코드만 제시하는 게 아니라, 문제를 어떻게 접근하고 최적화하는지 사고 과정을 함께 공유하겠습니다.

사전 지식 (초보자를 위한 기초)

1. 그래프(Graph)란?

그래프점(노드)선(간선)으로 이루어진 자료구조입니다.

예시: 친구 관계 그래프
    철수 ─── 영희
     │        │
    민수 ─── 지수
노드(Node): 철수, 영희, 민수, 지수 (사람)
간선(Edge): 친구 관계를 나타내는 선

그래프의 종류:

# 1. 무방향 그래프 (양방향)
# A ─ B (A → B, B → A 모두 가능)
graph = {
    'A': ['B', 'C'],
    'B': ['A', 'D'],
    'C': ['A'],
    'D': ['B']
}
# 2. 방향 그래프 (단방향)
# A → B (A에서 B로만 가능)
graph = {
    'A': ['B', 'C'],
    'B': ['D'],
    'C': [],
    'D': []
}

2. 트리(Tree)란?

트리사이클이 없는 그래프입니다. 부모-자식 관계로 이루어져 있습니다.

예시: 가족 관계 트리
        할아버지
       /        \
     아빠        삼촌
    /   \
  나    동생
특징:
- 루트(Root): 최상위 노드 (할아버지)
- 부모(Parent): 위 노드 (아빠)
- 자식(Child): 아래 노드 (나, 동생)
- 리프(Leaf): 자식이 없는 노드 (나, 동생, 삼촌)

3. 탐색(Traversal)이란?

탐색모든 노드를 한 번씩 방문하는 것입니다.

예시: 미로 탈출
S ─ □ ─ □
│   │   │
□ ─ □ ─ E
S: 시작점
E: 도착점
□: 갈 수 있는 곳
탐색: S에서 시작해서 E를 찾기

4. 큐(Queue)와 스택(Stack) 복습

큐 (Queue) - 선입선출 (FIFO)

from collections import deque
queue = deque()
queue.append(1)  # 뒤에 추가
queue.append(2)
queue.append(3)
print(queue.popleft())  # 1 (앞에서 제거)
print(queue.popleft())  # 2
print(queue.popleft())  # 3
# 비유: 줄 서기
# 먼저 온 사람이 먼저 나감

스택 (Stack) - 후입선출 (LIFO)

stack = []
stack.append(1)  # 위에 추가
stack.append(2)
stack.append(3)
print(stack.pop())  # 3 (위에서 제거)
print(stack.pop())  # 2
print(stack.pop())  # 1
# 비유: 접시 쌓기
# 나중에 올린 접시를 먼저 꺼냄

5. BFS vs DFS 직관적 이해

BFS (너비 우선 탐색) - 넓게 퍼지기

물결이 퍼지는 모습:
시작점에 돌을 던지면
물결이 동심원으로 퍼짐
    1 (시작)
   / \
  2   3 (1단계)
 / \   \
4   5   6 (2단계)
방문 순서: 1 → 2 → 3 → 4 → 5 → 6
(가까운 것부터 차례대로)

DFS (깊이 우선 탐색) - 깊게 파고들기

미로를 탐험하는 모습:
한 방향으로 끝까지 가고
막히면 되돌아와서 다른 길 시도
    1 (시작)
   / \
  2   5
 / \
3   4
방문 순서: 1 → 2 → 3 → 4 → 5
(한 길을 끝까지 간 후 다음 길)

6. 언제 BFS를, 언제 DFS를 사용할까?

BFS 사용 시기:

  • 최단 거리 찾기
  • 레벨별 탐색
  • 가장 가까운 노드 찾기
# 예시: 미로 최단 거리
# BFS는 가까운 곳부터 탐색하므로
# 처음 도착점에 도달하면 그게 최단 거리!

DFS 사용 시기:

  • 모든 경로 탐색
  • 백트래킹 (순열, 조합)
  • 사이클 검사
# 예시: 모든 경로 찾기
# DFS는 한 경로를 끝까지 탐색하므로
# 모든 가능한 경로를 찾을 수 있음

비교표:

특징BFSDFS
자료구조큐 (Queue)스택 (Stack) / 재귀
탐색 방식넓게 (레벨별)깊게 (한 방향)
최단 거리✅ 가능❌ 불가능
메모리많이 사용적게 사용
구현반복문재귀 (더 간단)

1. BFS (너비 우선 탐색)

BFS란?

BFS는 시작점에서 가까운 층부터 넓게 퍼지며 방문합니다. 연못에 돌을 던졌을 때 물결이 바깥으로 퍼지는 모습과 비슷하고, 가중치 없는 그래프에서는 최단 거리를 구할 때 자주 씁니다.

    1
   / \
  2   3
 / \
4   5
BFS 순서: 1 → 2 → 3 → 4 → 5 (레벨별)

Python 구현

BFS는 큐(Queue)를 사용하여 레벨별로 탐색합니다:

from collections import deque
def bfs(graph, start):
    # visited: 방문한 노드 집합 (중복 방문 방지)
    visited = set()
    
    # queue: 방문할 노드를 저장하는 큐 (FIFO)
    # deque 사용 이유: popleft()가 O(1) (list.pop(0)은 O(n))
    queue = deque([start])
    
    # 시작 노드를 방문 처리
    visited.add(start)
    
    # 탐색 결과를 저장할 리스트
    result = []
    
    # 큐가 빌 때까지 반복
    while queue:
        # 큐의 맨 앞 노드를 꺼냄 (FIFO)
        node = queue.popleft()
        
        # 노드 방문 처리
        result.append(node)
        
        # 현재 노드의 모든 이웃 노드 확인
        for neighbor in graph[node]:
            # 아직 방문하지 않은 노드만 처리
            if neighbor not in visited:
                # 방문 처리 (중복 방지)
                visited.add(neighbor)
                # 큐에 추가 (나중에 방문)
                queue.append(neighbor)
    
    return result
# 그래프 (인접 리스트 표현)
# 각 노드의 이웃 노드들을 리스트로 저장
graph = {
    1: [2, 3],      # 노드 1은 2, 3과 연결
    2: [1, 4, 5],   # 노드 2는 1, 4, 5와 연결
    3: [1],         # 노드 3은 1과 연결
    4: [2],         # 노드 4는 2와 연결
    5: [2]          # 노드 5는 2와 연결
}
print(bfs(graph, 1))  # [1, 2, 3, 4, 5]
# 탐색 과정 (start=1):
# 초기: queue=[1], visited={1}
#
# 1단계: node=1 꺼냄
#   - 이웃: 2, 3
#   - queue=[2, 3], visited={1, 2, 3}
#   - result=[1]
#
# 2단계: node=2 꺼냄
#   - 이웃: 1(방문함), 4, 5
#   - queue=[3, 4, 5], visited={1, 2, 3, 4, 5}
#   - result=[1, 2]
#
# 3단계: node=3 꺼냄
#   - 이웃: 1(방문함)
#   - queue=[4, 5], visited={1, 2, 3, 4, 5}
#   - result=[1, 2, 3]
#
# 4단계: node=4 꺼냄
#   - 이웃: 2(방문함)
#   - queue=[5], visited={1, 2, 3, 4, 5}
#   - result=[1, 2, 3, 4]
#
# 5단계: node=5 꺼냄
#   - 이웃: 2(방문함)
#   - queue=[], visited={1, 2, 3, 4, 5}
#   - result=[1, 2, 3, 4, 5]
#
# 큐가 비었으므로 종료

BFS의 특징:

  • 레벨별로 탐색 (가까운 노드부터)
  • 최단 경로 보장 (가중치 없는 그래프)
  • 큐 사용 (FIFO)
  • 메모리 사용량이 DFS보다 많을 수 있음 (넓은 그래프)

최단 경로 (거리 계산)

def bfs_shortest_path(graph, start, end):
    visited = {start: 0}  # 노드: 거리
    queue = deque([start])
    
    while queue:
        node = queue.popleft()
        
        if node == end:
            return visited[end]
        
        for neighbor in graph[node]:
            if neighbor not in visited:
                visited[neighbor] = visited[node] + 1
                queue.append(neighbor)
    
    return -1  # 경로 없음
# 테스트
print(bfs_shortest_path(graph, 1, 4))  # 2 (1→2→4)

2. DFS (깊이 우선 탐색)

DFS란?

DFS는 한 방향으로 끝까지 들어갔다가, 더 갈 곳이 없으면 이전 갈림길로 돌아옵니다. 미로에서 한쪽 벽만 따라 가다 막히면 되돌아가는 탐색과 같습니다.

    1
   / \
  2   3
 / \
4   5
DFS 순서: 1 → 2 → 4 → 5 → 3 (깊이 우선)

Python 구현 (재귀)

DFS는 재귀 또는 스택을 사용하여 깊이 우선으로 탐색합니다:

def dfs_recursive(graph, node, visited, result):
    # 현재 노드를 방문 처리
    visited.add(node)
    result.append(node)
    
    # 현재 노드의 모든 이웃 노드를 확인
    for neighbor in graph[node]:
        # 아직 방문하지 않은 노드만 재귀 호출
        if neighbor not in visited:
            # 재귀: 이웃 노드부터 끝까지 탐색
            # 백트래킹: 끝까지 갔다가 돌아옴
            dfs_recursive(graph, neighbor, visited, result)
# 사용
visited = set()  # 방문한 노드 집합
result = []      # 탐색 순서
dfs_recursive(graph, 1, visited, result)
print(result)  # [1, 2, 4, 5, 3]
# 탐색 과정 (start=1):
# 1. dfs(1) 호출
#    - visited={1}, result=[1]
#    - 이웃: 2, 3
#    - 2부터 재귀
#
# 2. dfs(2) 호출 (1의 첫 번째 이웃)
#    - visited={1, 2}, result=[1, 2]
#    - 이웃: 1(방문함), 4, 5
#    - 4부터 재귀
#
# 3. dfs(4) 호출 (2의 첫 번째 미방문 이웃)
#    - visited={1, 2, 4}, result=[1, 2, 4]
#    - 이웃: 2(방문함)
#    - 더 이상 미방문 노드 없음 → 백트랙
#
# 4. dfs(2)로 복귀
#    - 다음 이웃: 5
#    - 5 재귀
#
# 5. dfs(5) 호출
#    - visited={1, 2, 4, 5}, result=[1, 2, 4, 5]
#    - 이웃: 2(방문함)
#    - 백트랙
#
# 6. dfs(2)로 복귀 → dfs(1)로 복귀
#    - 다음 이웃: 3
#    - 3 재귀
#
# 7. dfs(3) 호출
#    - visited={1, 2, 3, 4, 5}, result=[1, 2, 4, 5, 3]
#    - 이웃: 1(방문함)
#    - 백트랙
#
# 8. 모든 재귀 종료

재귀의 장점:

  • 코드가 간결하고 직관적
  • 백트래킹 구현이 자연스러움 재귀의 단점:
  • 깊이가 깊으면 스택 오버플로우 위험
  • Python 기본 재귀 한도: 1000 (sys.setrecursionlimit로 변경 가능)

Python 구현 (스택)

재귀 대신 명시적 스택을 사용한 반복문 구현:

def dfs_iterative(graph, start):
    visited = set()  # 방문한 노드 집합
    stack = [start]  # 스택 (LIFO) - Python list 사용
    result = []      # 탐색 순서
    
    # 스택이 빌 때까지 반복
    while stack:
        # 스택의 맨 위 노드를 꺼냄 (LIFO)
        node = stack.pop()
        
        # 이미 방문한 노드는 건너뜀
        if node not in visited:
            # 노드 방문 처리
            visited.add(node)
            result.append(node)
            
            # 이웃 노드들을 스택에 추가
            # reversed(): 작은 번호부터 방문하기 위해 역순 추가
            # (스택은 LIFO이므로 나중에 추가된 것이 먼저 나옴)
            for neighbor in reversed(graph[node]):
                if neighbor not in visited:
                    stack.append(neighbor)
    
    return result
print(dfs_iterative(graph, 1))  # [1, 2, 4, 5, 3]
# 탐색 과정 (start=1):
# 초기: stack=[1], visited={}
#
# 1단계: node=1 꺼냄
#   - visited={1}, result=[1]
#   - 이웃: [2, 3]
#   - reversed([2, 3]) = [3, 2]
#   - stack=[3, 2] (2가 위에)
#
# 2단계: node=2 꺼냄 (스택 맨 위)
#   - visited={1, 2}, result=[1, 2]
#   - 이웃: [1, 4, 5]
#   - 1은 방문함, [4, 5] 추가
#   - reversed([4, 5]) = [5, 4]
#   - stack=[3, 5, 4] (4가 위에)
#
# 3단계: node=4 꺼냄
#   - visited={1, 2, 4}, result=[1, 2, 4]
#   - 이웃: [2] (방문함)
#   - stack=[3, 5]
#
# 4단계: node=5 꺼냄
#   - visited={1, 2, 4, 5}, result=[1, 2, 4, 5]
#   - 이웃: [2] (방문함)
#   - stack=[3]
#
# 5단계: node=3 꺼냄
#   - visited={1, 2, 3, 4, 5}, result=[1, 2, 4, 5, 3]
#   - 이웃: [1] (방문함)
#   - stack=[]
#
# 스택이 비었으므로 종료

재귀 vs 스택 비교:

# 재귀 방식
# 장점: 코드 간결, 백트래킹 자연스러움
# 단점: 스택 오버플로우 위험 (깊이 제한)
# 스택 방식
# 장점: 스택 오버플로우 없음, 메모리 제어 가능
# 단점: 코드가 조금 더 복잡
# 깊이가 1000 이상이면 스택 방식 권장

3. BFS vs DFS 비교

특징BFSDFS
자료구조스택/재귀
탐색 순서레벨별깊이 우선
최단 경로OX
메모리많음적음
구현반복문재귀
시간복잡도O(V+E)O(V+E)
언제 BFS?
  • ✅ 최단 경로
  • ✅ 레벨 순회
  • ✅ 가장 가까운 노드 언제 DFS?
  • ✅ 모든 경로 탐색
  • ✅ 백트래킹
  • ✅ 사이클 검사

4. 실전 문제

문제 1: 미로 탈출 (BFS)

from collections import deque
def maze_escape(maze):
    """
    (0,0)에서 (n-1,m-1)까지 최단 거리
    1: 이동 가능, 0: 벽
    """
    n, m = len(maze), len(maze[0])
    queue = deque([(0, 0, 1)])  # (행, 열, 거리)
    visited = {(0, 0)}
    
    # 상하좌우
    directions = [(-1,0), (1,0), (0,-1), (0,1)]
    
    while queue:
        r, c, dist = queue.popleft()
        
        if r == n-1 and c == m-1:
            return dist
        
        for dr, dc in directions:
            nr, nc = r + dr, c + dc
            
            if (0 <= nr < n and 0 <= nc < m and 
                maze[nr][nc] == 1 and (nr, nc) not in visited):
                visited.add((nr, nc))
                queue.append((nr, nc, dist + 1))
    
    return -1
# 테스트
maze = [
    [1, 0, 1, 1, 1],
    [1, 0, 1, 0, 1],
    [1, 0, 1, 0, 1],
    [1, 1, 1, 0, 1]
]
print(maze_escape(maze))  # 9

문제 2: 섬의 개수 (DFS)

def count_islands(grid):
    """
    1로 연결된 영역의 개수
    """
    if not grid:
        return 0
    
    n, m = len(grid), len(grid[0])
    visited = set()
    count = 0
    
    def dfs(r, c):
        if (r < 0 or r >= n or c < 0 or c >= m or
            grid[r][c] == 0 or (r, c) in visited):
            return
        
        visited.add((r, c))
        
        # 상하좌우 탐색
        dfs(r-1, c)
        dfs(r+1, c)
        dfs(r, c-1)
        dfs(r, c+1)
    
    for i in range(n):
        for j in range(m):
            if grid[i][j] == 1 and (i, j) not in visited:
                dfs(i, j)
                count += 1
    
    return count
# 테스트
grid = [
    [1, 1, 0, 0, 0],
    [1, 1, 0, 0, 0],
    [0, 0, 1, 0, 0],
    [0, 0, 0, 1, 1]
]
print(count_islands(grid))  # 3

정리

핵심 요약

  1. BFS: 큐 사용, 최단 경로, O(V+E)
  2. DFS: 스택/재귀, 모든 경로, O(V+E)
  3. 선택 기준: 최단 경로 → BFS, 모든 경로 → DFS
  4. 구현: BFS는 큐, DFS는 재귀가 간단

추천 문제

백준:


관련 글

심화 부록: 구현·운영 관점

이 부록은 앞선 본문에서 다룬 주제(「BFS와 DFS | 그래프 탐색 알고리즘 완벽 정리」)를 구현·런타임·운영 관점에서 다시 압축합니다. 도메인별 세부 구현은 글마다 다르지만, 입력 검증 → 핵심 연산 → 부작용(I/O·네트워크·동시성) → 관측의 흐름으로 장애를 나누면 원인 추적이 빨라집니다.

내부 동작과 핵심 메커니즘

flowchart TD
  A[입력·요청·이벤트] --> B[파싱·검증·디코딩]
  B --> C[핵심 연산·상태 전이]
  C --> D[부작용: I/O·네트워크·동시성]
  D --> E[결과·관측·저장]
sequenceDiagram
  participant C as 클라이언트/호출자
  participant B as 경계(런타임·게이트웨이·프로세스)
  participant D as 의존성(API·DB·큐·파일)
  C->>B: 요청/이벤트
  B->>D: 조회·쓰기·RPC
  D-->>B: 지연·부분 실패·재시도 가능
  B-->>C: 응답 또는 오류(코드·상관 ID)
  • 불변 조건(Invariant): 버퍼 경계, 프로토콜 상태, 트랜잭션 격리, FD 상한 등 단계별로 문장으로 적어 두면 디버깅 비용이 줄어듭니다.
  • 결정성: 순수 층과 시간·네트워크·스케줄에 의존하는 층을 분리해야 테스트와 장애 분석이 쉬워집니다.
  • 경계 비용: 직렬화, 인코딩, syscall 횟수, 락 경합, 할당·GC, 캐시 미스를 의심 목록에 둡니다.
  • 백프레셔: 생산자가 소비자보다 빠를 때 버퍼·큐·스트림에서 속도를 줄이는 신호를 어디에 둘지 정의합니다.

프로덕션 운영 패턴

영역운영 관점 질문
관측성요청 단위 상관 ID, 에러율·지연 p95/p99, 의존성 타임아웃·재시도가 대시보드에 보이는가
안전성입력 검증·권한·비밀·감사 로그가 코드 경로마다 일관적인가
신뢰성재시도는 멱등 연산에만 적용되는가, 서킷 브레이커·백오프·DLQ가 있는가
성능캐시·배치 크기·커넥션 풀·인덱스·백프레셔가 데이터 규모에 맞는가
배포롤백 룬북, 카나리/블루그린, 마이그레이션·피처 플래그가 문서화되어 있는가
용량피크 트래픽·디스크·FD·스레드 풀 상한을 주기적으로 검증하는가

스테이징은 데이터 양·네트워크 RTT·동시성을 프로덕션에 가깝게 맞출수록 재현율이 올라갑니다.

확장 예시: 엔드투엔드 미니 시나리오

앞선 본문 주제(「BFS와 DFS | 그래프 탐색 알고리즘 완벽 정리」)를 배포·운영 흐름에 맞춰 옮긴 체크리스트입니다. 도메인에 맞게 단계 이름만 바꿔 적용할 수 있습니다.

  1. 입력 계약 고정: 스키마·버전·최대 페이로드·타임아웃·에러 코드를 경계에 둔다.
  2. 핵심 경로 계측: 요청 ID, 단계별 지연, 외부 호출 결과 코드를 로그·메트릭·트레이스에서 한 흐름으로 본다.
  3. 실패 주입: 의존성 타임아웃·5xx·부분 데이터·락 대기를 스테이징에서 재현한다.
  4. 호환·롤백: 설정/마이그레이션/클라이언트 버전을 되돌릴 수 있는지 확인한다.
  5. 부하 후 검증: 피크 대비 p95/p99, 에러율, 리소스 상한, 알림 임계값을 점검한다.
handle(request):
  ctx = newCorrelationId()
  validated = validateSchema(request)
  authorize(validated, ctx)
  result = domainCore(validated)
  persistOrEmit(result, idempotentKey)
  recordMetrics(ctx, latency, outcome)
  return result

문제 해결(Troubleshooting)

증상가능 원인조치
간헐적 실패레이스, 타임아웃, 외부 의존성, DNS최소 재현 스크립트, 분산 트레이스·로그 상관관계, 재시도·서킷 설정 점검
성능 저하N+1, 동기 I/O, 락 경합, 과도한 직렬화, 캐시 미스프로파일러·APM으로 핫스팟 확인 후 한 가지씩 제거
메모리 증가캐시 무제한, 구독/리스너 누수, 대용량 버퍼, 커넥션 미반납상한·TTL·힙/FD 스냅샷 비교
빌드·배포만 실패환경 변수, 권한, 플랫폼 차이, lockfileCI 로그와 로컬 diff, 런타임·이미지 버전 핀
설정 불일치프로필·시크릿·기본값, 리전스키마 검증된 설정 단일 소스와 배포 매트릭스 표준화
데이터 불일치비멱등 재시도, 부분 쓰기, 캐시 무효화 누락멱등 키·아웃박스·트랜잭션 경계 재검토

권장 순서: (1) 최소 재현 (2) 최근 변경 범위 축소 (3) 환경·의존성 차이 (4) 관측으로 가설 검증 (5) 수정 후 회귀·부하 테스트.

배포 전에는 git addgit commitgit pushnpm run deploy 순서를 권장합니다.


자주 묻는 질문 (FAQ)

Q. 이 내용을 실무에서 언제 쓰나요?

A. BFS와 DFS: 그래프 탐색 알고리즘 완벽 정리. BFS (너비 우선 탐색)·DFS (깊이 우선 탐색)로 흐름을 잡고 원리·코드·실무 적용을 한글로 정리합니다. 알고리즘·BFS·DFS 중심으로 설명합니다. Star… 실무에서는 위 본문의 예제와 선택 가이드를 참고해 적용하면 됩니다.

Q. 선행으로 읽으면 좋은 글은?

A. 각 글 하단의 이전 글 또는 관련 글 링크를 따라가면 순서대로 배울 수 있습니다. C++ 시리즈 목차에서 전체 흐름을 확인할 수 있습니다.

Q. 더 깊이 공부하려면?

A. cppreference와 해당 라이브러리 공식 문서를 참고하세요. 글 말미의 참고 자료 링크도 활용하면 좋습니다.


같이 보면 좋은 글 (내부 링크)

이 주제와 연결되는 다른 글입니다.


이 글에서 다루는 키워드 (관련 검색어)

알고리즘, BFS, DFS, 그래프, 탐색, 코딩테스트, 트리 등으로 검색하시면 이 글이 도움이 됩니다.