그래프에 대한 설명 참고
DFS
DFS는 Depth-First-Search, 깊이 우선 탐색이라고도 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다. DFS는 스택 자료구조를 이용하며 구체적인 동작 과정은 다음과 같다.
- 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
- 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
- 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 번호가 낮은 순서부터 처리한다. (이건 문제에 따라 다르게 적용시킬 수 있다.)
DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.
# DFS 메서드 정의
def dfs(graph,v,visited):
# 현재 노드를 방문 처리
visited[v]=True
print(v,end=' ')
# 현재 노드와 연결된 다른 노드를 재귀적으로 방문
for i in graph[v]:
if not visited[i]:
dfs(graph,i,visited)
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph=[
[],
[2,3,8],
[1,7],
[1,4,5],
[3,5],
[3,4],
[7],
[2,6,8],
[1,7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited=[False]*9
# 정의된 DFS 함수 호출
dfs(graph,1,visited)
노드 1번부터 출발하기 때문에 편리함을 위해 graph의 0번째 행은 비워두었고, visited 역시 index를 위해 8이 아닌 9개를 할당받았다.
시간은 O(N)만큼 소요된다.
+) 스택과 DFS
함수 호출은 컴퓨터 구조 상 스택의 형태로 쌓이게 된다. 즉 dfs에서 함수 호출은 스택에 push되는 것과 동일하게 볼 수 있다.
DFS 동작과정을 다시 살펴 보자.
- 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다. -> 탐색 시작 노드를 '함수 호출'하고 'visited=True'한다.
- 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다. -> '현재 실행 중인 함수'의 노드에 대한 인접리스트를 탐색해서 visited==False인 노드에 대해 '함수 호출'을 한다. 만약 인접 리스트의 노드들이 전부 visited==True면 '함수 종료'한다.
- 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다. -> 모든 함수가 전부 종료될 때까지(스택이 빌 때까지) 반복한다.
BFS
BFS, Breadth First Search 알고리즘은 '너비 우선 탐색'이라는 의미를 가진다. 쉽게 말해 가까운 노드부터 탐색하는 알고리즘이다. BFS는 큐 자료구조를 이용하는 것이 정석이다. 알고리즘의 정확한 동작 방식은 다음과 같다.
- 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
- 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
- 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
from collections import deque
# BFS 메서드 정의
def bfs(graph,start,visited):
# 큐(Queue) 구현을 위해 deque 라이브러리 사용
queue=deque([start])
# 현재 노드를 방문 처리
visited[start]=True
# 큐가 빌 때까지 반복
while queue:
# 큐에서 하나의 원소를 뽑아 출력
v=queue.popleft()
print(v,end=' ')
# 해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i]=True
# 각 노드가 연결된 정보를 리스트 자료형으로 표현(2차원 리스트)
graph=[
[],
[2,3,8],
[1,7],
[1,4,5],
[3,5],
[3,4],
[7],
[2,6,8],
[1,7]
]
# 각 노드가 방문된 정보를 리스트 자료형으로 표현(1차원 리스트)
visited=[False]*9
# 정의된 DFS 함수 호출
bfs(graph,1,visited)
시간은 O(N)만큼 소요된다. DFS는 재귀 함수 특성상 함수 호출시간이 여러 번 있기 때문에 일반적으로 BFS가 DFS보다 조금 더 빠르게 동작한다.
+) dfs는 재귀함수를 이용하여 함수 호출 자체를 스택 자료구조처럼 사용했지만 bfs의 경우 큐 자료구조를 따로 함수에서 명시 해주어야 한다.(deque)
dfs와 마찬가지로 bfs 역시 자료구조(큐)에 append될 때 방문 처리해준다.
문제를 풀면서 느끼는 점
DFS/BFS 탐색 문제에서 준비물은 3가지로 정리할 수 있다.
- 탐색할 대상(그래프 or 격자(N*M))
- 방문 정보(visited)
- 자료구조(DFS - 함수 자체(스택), BFS - 큐)
중요한 것은 방문정보를 어떻게 표현할 것이고, 자료구조에 어떤 값들을 저장하며 운용할 것인지 정하는 것이다.
<방문정보>는 인접 리스트(그래프)의 경우 True or False 정보로 설정하거나 문제에 따라서 distance 값을 갖는 리스트를 방문정보로서 사용할 수도 있다.
만약 탐색할 대상이 격자의 형태로 제공되는 경우 탐색할 대상 자체에 방문정보를 저장하는 방법을 사용하면 편리하다. 예를 들어, 시작점으로부터 거리 or 전파된 대상 등이 있다.
<자료구조>의 경우 함께 처리해야 하는 정보들은 튜플로 한 번에 자료구조에 저장하는 것이 편하다.
만약 그래프 좌표에 따른 시간을 측정해야 한다면 dfs의 경우 함수 호출시 dfs(x,y,count)로 호출하고, bfs의 경우 q=deque([x,y,count])처럼 같이 운용할 수 있다.
'algorithm > theory' 카테고리의 다른 글
이진 탐색 (0) | 2021.01.21 |
---|---|
정렬 (0) | 2021.01.20 |
구현 (0) | 2021.01.05 |
그리디 (0) | 2021.01.04 |
복잡도 (0) | 2021.01.04 |