Computer Science/Algorithm

[Algorithm] 다양한 그래프 알고리즘 : 서로소 집합(union-find), 크루스칼 알고리즘(Kruskal Algorithm), 위상 정렬(topology sort)

728x90

 

 

서로소 집합 (Disjoint Sets)

: 공통 원소가 없는 두 집합

 

> 서로소 집합 자료구조 (union-find 자료구조)

- 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조

- 연산

    * union 연산 : 2개의 집합을 하나의 집합으로 합치는 연산

    * find 연산 : 특정 원소가 속한 집합이 어떤 집합인지 알려주는 연산

- 트리 자료구조를 이용하여 집합을 표현한다

 

 

> 서로소 집합 계산 알고리즘

1. union(합집합) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인한다

    (1) A와 B의 루트 노드 A', B'를 각각 찾는다

    (2) A'를 B'의 부모 노드로 설정한다 (B'가 A'를 가리키도록 한다)

2. 모든 union(합집합) 연산을 처리할 때까지 1번 과정을 반복한다

 

 

> Code with Python : 서로소 집합 알고리즘

def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]


def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


v, e = map(int, input().split())
parent = [0] * (v + 1)

for i in range(1, v + 1):
    parent[i] = i

for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

print('각 원소가 속한 집합: ', end='')
for i in range(1, v + 1):
    print(find_parent(parent, i), end=' ')

print()

print('부모 테이블: ', end='')
for i in range(1, v + 1):
    print(parent[i], end=' ')

# 각 원소가 속한 집합: 1 1 1 1 5 5 
# 부모 테이블: 1 1 1 1 5 5

 

 

> Code with Python : 서로소 집합을 활용한 사이클 판별

def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]


def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


v, e = map(int, input().split())
parent = [0] * (v + 1)

for i in range(1, v + 1):
    parent[i] = i

cycle = False  # 사이클 발생 여부

for i in range(e):
    a, b = map(int, input().split())

    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    else:
        union_parent(parent, a, b)

if cycle:
    print("사이클이 발생했습니다")
else:
    print("사이클이 발생하지 않았습니다")

# 3 3
# 1 2
# 1 3
# 2 3
# 사이클이 발생했습니다

 

 

 

 


신장 트리 (Spanning Tree)

: 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프

 

 

 

 

크루스칼 알고리즘 (Kruskal Algorithm)

- 신장 트리 중에서 최소 비용으로 만들 수 있는 최소 신장 트리 알고리즘 중 대표적인 알고리즘

- 그리디 알고리즘

 

 

> 원리

1. 간선 데이터를 비용에 따라 오름차순 정렬

2. 간선을 하나씩 확인하며 현재 간선이 사이클을 발생시키는지 확인

    (1) 사이클이 발생하지 않는 경우, 최소 신장 트리에 포함시킨다

    (2) 사이클이 발생하는 경우, 최소 신장 트리에 포함시키지 않는다

3. 모든 간선에 대해 2번의 과정을 반복한다

 

 

> Code with Python : Kruskal Algorithm

def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]


def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


v, e = map(int, input().split())
parent = [0] * (v + 1)

edges = []
result = 0

for i in range(1, v + 1):
    parent[i] = i

for _ in range(e):
    a, b, cost = map(int, input().split())
    edges.append((cost, a, b))

edges.sort()

for edge in edges:
    cost, a, b = edge
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        result += cost

print(result)

# input
# 7 9
# 1 2 29
# 1 5 75
# 2 3 35
# 2 6 34
# 3 4 7
# 4 6 23
# 4 7 13
# 5 6 53
# 6 7 25

# output
# 159

 

 

> 시간 복잡도

- 시간 복잡도 : O(ElogE)

    * 가장 오래 걸리는 부분이 간선을 정렬하는 작업

    * E개의 데이터를 정렬했을 때의 시간 복잡도 : O(ElogE)

    * 서로소 집합 알고리즘은 정렬 알고리즘보다 시간복잡도가 작으므로 무시해도 된다

 

 

 

 


위상 정렬 (Topology Sort)

- 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 정렬 알고리즘

 

 

> 원리

1. 진입차수가 0인 노드를 큐에 넣는다

2. 큐가 빌 때까지 다음의 과정을 반복한다

    (1) 큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거한다

    (2) 새롭게 진입차수가 0이 된 노드를 큐에 넣는다

 

* 모든 원소를 방분하기 전 큐가 빈다면 사이클이 존재한다

* 한 단계에서 큐에 새롭게 들어가는 원소가 2개 이상인 경우가 있다면, 여러 가지 답이 존재한다

 

 

> Code with Python : 위상 정렬

from collections import deque

v, e = map(int, input().split())
indegree = [0] * (v + 1)
graph = [[] for i in range(v + 1)]

for _ in range(e):
    a, b = map(int, input().split())
    graph[a].append(b)
    indegree[b] += 1

def topology_sort():
    result = []
    q = deque()

    for i in range(1, v + 1):
        if indegree[i] == 0:
            q.append(i)

    while q:
        now = q.popleft()
        result.append(now)

        for i in graph[now]:
            indegree[i] -= 1
            if indegree[i] == 0:
                q.append(i)

    for i in result:
        print(i, end=' ')

topology_sort()

 

 

> 시간 복잡도

- 시간 복잡도 : O(V + E)

    * 모든 노드를 확인하면서 해당 노드에서 출발하는 간선을 차례대로 제거한다는 측면에서 O(V + E)의 시간 복잡도

 

 

 

 

 

 

 

 

📚 참고서적 : 이것이 코딩테스트다 with 파이썬

 

 

728x90