🧑🏻💻
알고리즘 박살내기 - 24. 계수정렬
May 09, 2022
덧!
중간에 공부한 내용을 빼먹고 진도를 나가(…) 순서를 맞추기 위해 부득이하게 data를 수정했습니다 ㅠ.. 실제 학습일 : 2022.05.05
Introduction
본 포스트는 알고리즘 학습에 대한 정리를 재대로 하기 위하여 남기는 것입니다. 더불어 기본 내용은 나동빈 저의 〖이것이 취업을 위한 코딩 테스트다〗라는 교재 및 유튜브 강의의 내용에서 발췌했고, 그 외 추가적인 궁금 사항들을 검색 및 정리해둔 것입니다.
계수정렬
개념
- 특정 조건이 부합한 경우에만 사용 가능한 정렬로, 매우 빠른 동작의 정렬 알고리즘입니다.
- 계수 정렬은 데이터의 크기 범위가 제한되어
정수 형태
로 표현할 수 있을 때까지만 사용 가능합니다. - 데이터의 개수가 N, 데이터(양수)중 최대값이 K일 때 최악의 경우에도 수행시간은 O(N + K)를 보장합니다.
- 공간복잡도 면에서는 데이터의 범위만큼 배열을 만들어 기록해놔야 하므로 비효율적일 순 있으나, 조건만 만족한다면 매우 빠른 속도로 처리가 가능하다는 장점을 갖고 있습니다.
계수 정렬 동작 예시
- step 0
- 가장 작은 데이터부터 가장 큰 데이터까지의 범위가 모두 담길 수 있도록 리스트를 생성합니다.
- 정렬할 데이터 : 7 5 8 0 3 1 6 2 9 1 4 8 0 5 2
- 각각의 데이터의 횟수를 측정하는 방식을 사용합니다.
인덱스 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
개수(count) | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 |
- step 1
- 반복문을 통해 전체 데이터가 몇 번 등장하는지를 개수를 셉니다.
- 결과적으로 최종 리스트에는 각 데이터가 몇 번씩 등장했는지 그 횟수를 기록합니다.
인덱스 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
개수(count) | 2 | 2 | 2 | 1 | 1 | 2 | 1 | 1 | 1 | 2 |
- step final
- 최종적으로 결과를 확인할 때는 리스트의 첫 데이터부터 하나씩 그 값만 큼 반복하여 인덱스를 출력하면 됩니다.
인덱스 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
---|---|---|---|---|---|---|---|---|---|---|
개수(count) | 2 | 2 | 2 | 1 | 1 | 2 | 1 | 1 | 1 | 2 |
- 출력결과 : 0 0 1 1 2 2 3 4 5 5 6 7 8 9 9
계수 정렬 소스 코드(Python)
# 모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 8, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
# 모든 범위를 포함하는 리스트를 선언하고, 값은 0으로 초기화 한다.
count = [0] * (max(array) + 1)
for i in range(len(array)):
count[array[i]] += 1
# 각 데이터에 해당하는 인덱스 값을 증가 시킨다.
for i in range(len(count)):
for j in range (count[i]):
print(i, end=' ')
# 계수를 샌 정보를 확인함으로써, 리스트에 기록된 정렬 정보를 확인하고,
# 띄워쓰기를 구분으로 등장한 횟수만큼 인덱스 출력
# 실행 결과
# 0 0 1 1 2 2 3 4 5 5 6 7 8 9 9
계수 정렬 소스 코드(C++)
#include <bits/stdc++.h>
#define MAX_VALUE 9
using namespace std;
int n = 15;
int arr[15] = {7, 5, 8, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2}
int cnt [MAX_VALUE + 1];
int main(void)
{
for (int i = 0; i < n; i++)
cnt[arr[i]] += 1;
for (int i = 0; i <= MAX_VALUE; i++)
for (int j = 0; j < cnt[i]; j++)
cout << i << ' ';
}
계수 정렬의 복잡도 분석
- 계수 정렬의 시간복잡도와 공간복잡도는 모두 O(N + K)입니다.
- 계수 정렬은 때에 따라 심각한 비효율성을 초래할 수 있습니다. 데이터가 0, 999999 2개만 존재한다고 하면? 해당 로직을 활용시 심각해질 수 있습니다.
- 계수 정렬은 동일한 값을 가지는 데이터가 여러번 등장할 때 효과적으로 사용할 수 있습니다.
- 성적을 점수별로 정렬을 하는 경우 동일 점수가 여러명이기에 계수정렬이 효과적일 수 있습니다