자료 구조의 정의
효율적인 프로그램을 작성할 때 가장 우선적인 고려사항은 저장 공간의 효율성과 실행시간의 신속성이다.
자료 구조는 프로그램에서 사용하기 위한 자료를 기억장치의 공간 내에 저장하는 방법과 저장된 그룹 내에 존재하는 자료 간의 관계, 처리 방법 등을 연구 분석하는 것을 말한다.
자료구조와 알고리즘의 관계
Algorithm(알고리즘 또는 알고리듬)은 어떤 문제를 해결하기 위해 정해진 일련의 절차나 방법을 공식화한 형태로 표현한 것. 문제풀이에 필요한 계산절차 또는 처리과정의 순서다.
알고리즘의 중요한 특징은 같은 지식수준을 가진 사람이라면 그 알고리즘을 보고 누구나 같은 결과를 낼 수 있어야 한다. 요리의 레시피(recipe)에 비유해 볼 수 있다.
보통 자료 구조가 선택되면 그에 적용할 알고리즘은 거의 명확해진다. 즉, 자료 구조가 효율적인 알고리즘을 사용할 수 있게 함으로 자료 구조와 알고리즘은 매우 밀접한 관계를 가지게 되며, 보통은 자료 구조의 선택 ➡ 효율적인 알고리즘의 선택이 된다.
또한 알고리즘을 프로그램 명령어들의 집합이라고도 한다.
프로그램은 특정 문제를 해결하기 위한 처리 방법과 순서를 기록한 명령어들의 모음이다. 이 프로그램이 실행되기 위해서는 메모리에 올릴 데이터가 필요하며 이 데이터들을 담아내는 방식은 자료구조다.
즉, 넓은 의미에서 자료구조 + 알고리즘(+a) = 프로그램이라고 할 수 있다.
위의 정의만 보면 프로그램 = 알고리즘 같아 보이지만, 디테일을 따지면 엄연히 다르다. 가장 간단한 예로 알고리즘은 항상 같은 결과를 보장하지만 프로그램은 그렇지 않을 수 있다.
자료 구조의 분류
1. 배열(Array)
- 동일한 타입의 데이터들을 저장하며, 고정된 크기를 가지고 있다.
- 인덱싱이 되어 있어 인덱스 번호로 데이터에 접근할 수 있다.
➡ 배열 목록, 힙, 해시 테이블, 벡터 및 행렬과 같은 기타 데이터 구조를 구축하기 위한 빌딩 블록으로 사용
➡ 삽입 정렬, 빠른 정렬, 버블 정렬 및 병합 정렬과 같은 다양한 정렬 알고리즘에 사용
2. Linked List(연결 리스트)
- 각 데이터 시퀀스가 순서를 가지고 연결된 순차적 구조
- 동적인 데이터 추가/삭제에 유리하다.
- 각 요소는 Node
- 각 Node에는 key와 다음 노드를 가리키는 포인터인 next가 포함
- 첫 번째 요소는 Head
- 마지막 요소는 Tail
➡ Alt + Tab을 사용하여 프로그램 간 전환
➡ 갤러리
3. Stack(스택)
- 순서가 보존되는 선형 데이터 구조
- 가장 마지막 요소(가장 최근 요소)부터 처리하는 LIFO (Last In First Out)
➡ 실행 취소
➡ 수학적 표현식을 구문 분석하고 평가
➡ 재귀 프로그래밍에서 함수 호출을 구현
4. Queue(큐)
- 가장 먼저 입력된 요소를 처리하는 FIFO (First In First Out)
➡ 멀티스레딩에서 스레드를 관리
➡ 대기열 시스템
5. Hash table(해시 테이블)
- 해시함수를 사용하여 변환한 값을 색인(index)으로 삼아 키(key)와 데이터(value)를 저장하는 자료구조
- 데이터의 크기에 관계없이 삽입 및 검색에 매우 효율적
➡ 데이터베이스 인덱스 구현
➡ 사용자 로그인 인증
➡ "set" 데이터 구조 구현
보통 테이블 내에 더 작은 서브그룹인 버킷(bucket)에 키/값(key/value) 쌍(pair)을 저장한다.
단, 충돌이 자주 일어날 수 있으며 이를 위해 다양한 방법으로 해시 함수를 개선하거나 해시 테이블의 구조 개선(chaining, open addressing 등)의 방법이 사용된다.
6. Graph(그래프)
- nodes/vertices(노드) 사이에 edge(엣지)가 있는 collection
- directed(방향) 그래프는 일방통행
- undirected(무방향) 그래프는 양방향
➡ 소셜 미디어 네트워크를 나타내는 데 사용
➡ 검색 엔진에 의해 웹 페이지 및 링크를 나타내는 데 사용
➡ GPS에서 위치와 경로를 나타내는 데 사용
7. Tree(트리)
- 그래프가 계층적 구조를 가진 형태
- 최상위 노드(루트)를 가지고 있음
- 상위 노드를 부모(parent) 노드, 하위 노드를 자식(child) 노드라 한다.
➡ Binary Trees(이진트리)
➡ Binary Search Tree(이진 검색 트리)
➡ Heap(힙)
8. Heap(힙)
- Binary Tree(이진트리)
- 최소 힙 : 부모의 키 값이 자식의 키 값보다 작거나 같다.
- 루트 노드의 키 값이 트리의 최솟값
- 최대 힙: 부모의 키 값이 자식의 키 값보다 크거나 같다.
- 루트 노드의 키 값이 트리의 최댓값
➡ 힙 정렬 알고리즘
➡ 우선순위 큐
'[IT 지식] > 컴퓨터과학' 카테고리의 다른 글
리눅스의 특징과 표준 디렉토리 (0) | 2024.06.19 |
---|---|
데이터정보처리입문 핵심용어 정리 (0) | 2024.05.31 |
[데이터베이스] 속성(Attribute) 정리 (0) | 2023.01.14 |
[데이터베이스] 엔터티(Entity) 정리 (0) | 2023.01.14 |
[데이터베이스] 데이터 모델링의 이해 (0) | 2023.01.13 |