스레드와 동기화 (Thread)

이해하기 쉽고, 장황하지 않은 자료를 기반으로 강의를 진행합니다.
잔재미코딩 소식 공유
좀더 제약없이, IT 컨텐츠를 공유하고자, 자체 온라인 사이트와, 다음 두 채널도 오픈하였습니다
응원해주시면, 곧 좋은 컨텐츠를 만들어서 공유하겠습니다
●  잔재미코딩 뉴스레터 오픈 [구독해보기]
●  잔재미코딩 유투브 오픈 [구독해보기]

8. 스레드와 동기화

Thread (스레드)

  • Light Weight Process 라고도 함
  • 프로세스
    • 프로세스 간에는 각 프로세스의 데이터 접근이 불가
  • 스레드
    • 하나의 프로세스에 여러개의 스레드 생성 가능
    • 스레드들은 동시에 실행 가능
    • 프로세스 안에 있으므로, 프로세스의 데이터를 모두 접근 가능

Thread는 각기 실행이 가능한 stack 존재

Process VS Thread
No description has been provided for this image

OS.xlsx -> Thread


Multi Thread (멀티 스레드)

  • 소프트웨어 병행 작업 처리를 위해 Multi Thread를 사용함
No description has been provided for this image

멀티 프로세싱과 Thread

  • 멀티 태스킹과 멀티 프로세싱
No description has been provided for this image
  • 출처: http://donghoson.tistory.com/15

  • 최근 CPU는 멀티 코어를 가지므로, Thread를 여러 개 만들어, 멀티 코어를 활용도를 높임


멀티 프로세스와 멀티 태스킹

No description has been provided for this image

Thread 장점1

  1. 사용자에 대한 응답성 향상
No description has been provided for this image

Thread 장점2

  1. 자원 공유 효율
    • IPC 기법과 같이 프로세스간 자원 공유를 위해 번거로운 작업이 필요 없음
    • 프로세스 안에 있으므로, 프로세스의 데이터를 모두 접근 가능
No description has been provided for this image

Thread 장점3

  1. 작업이 분리되어 코드가 간결
    • 사실 작성하기 나름

Thread 단점

  • 스레드 중 한 스레드만 문제가 있어도, 전체 프로세스가 영향을 받음

  • 멀티 프로세스

No description has been provided for this image
  • 멀티 스레드
No description has been provided for this image

Thread 단점

  • 스레드를 많이 생성하면, Context Switching이 많이 일어나, 성능 저하

  • 예: 리눅스 OS에서는 Thread를 Process와 같이 다룸

    • 스레드를 많이 생성하면, 모든 스레드를 스케쥴링해야 하므로, Context Switching이 빈번할 수 밖에 없음

Thread vs Process

  • 프로세스는 독립적, 스레드는 프로세스의 서브셋
  • 프로세스는 각각 독립적인 자원을 가짐, 스레드는 프로세스 자원 공유
  • 프로세스는 자신만의 주소영역을 가짐, 스레드는 주소영역 공유
  • 프로세스간에는 IPC 기법으로 통신해야 함, 스레드는 필요 없음

PThread

  • POSIX 스레드(POSIX Threads, 약어: PThread)
    • Thread 관련 표준 API

정리

  • Thread 개념 정리
    • 프로세스와 달리 스레드간 자원 공유
  • 스레드 장점
    • CPU 활용도를 높이고,
    • 성능 개선 가능
    • 응답성 향상
    • 자원 공유 효율 (IPC를 안써도 됨)
  • 스레드 단점
    • 하나의 스레드 문제가, 프로세스 전반에 영향을 미침
    • 여러 스레드 생성시 성능 저하 가능

동기화(Synchronization)


여기서 잠깐!

스레드 너무 좋아하세요 사실 별거 아닙니다. 하지만 스레드 관리가 힘들어요. 개념/원리를 이해해놓으면, 사용하다 문제가 생겼을 때, 어떤 부분이 잘못될 수 있는지, 왜 특별한 함수들을 사용하는지를 이해할 수 있습니다.


동기화(Synchronization) 이슈

  • 동기화: 작업들 사이에 실행 시기를 맞추는 것
  • 여러 스레드가 동일한 자원(데이터) 접근시 동기화 이슈 발생
    • 동일 자원을 여러 스레드가 동시 수정시, 각 스레드 결과에 영향을 줌

동기화(Synchronization) 이슈 예제

  • 컴퓨터 구조, 파이썬과 함께 복습

python_mutual_exclusion OS.xlsx -> Thread Synchronization


동기화 이슈 해결 방안

  • Mutual exclusion (상호 배제)

  • 쓰레드는 프로세스 모든 데이터를 접근할 수 있으므로,

    • 여러 스레드가 변경하는 공유 변수에 대해 Exclusive Access 필요
    • 어느 한 스레드가 공유 변수를 갱신하는 동안 다른 스레그가 동시 접근하지 못하도록 막아라

Mutual exclusion (상호 배제)

  • 임계 자원(critical resource)
  • 임계 영역(critical section)
lock.acquire()           
    for i in range(100000):
        g_count += 1
    lock.release()

동기화 이슈 해결 예제

python_mutual_exclusion.ipynb

동기화(Synchronization)와 세마포어


Mutex와 세마포어 (Semaphore)

  • Critical Section(임계 구역)에 대한 접근을 막기 위해 LOCKING 메커니즘이 필요
    • Mutex(binary semaphore) : 임계구역에 하나의 스레드만 들어갈 수 있음
    • Semaphore : 임계구역에 여러 스레드가 들어갈 수 있음 : counter를 두어서 동시에 리소스에 접근 할 수 있는 허용 가능한 스레드 수를 제어

세마포어 (Semaphore)

  • P: 검사 (임계영역에 들어갈 때)
    • S값이 1 이상이면, 임계 영역 진입 후, S값 1 차감 (S값이 0이면 대기)
  • V: 증가 (임계영역에서 나올 때)
    • S값을 1 더하고, 임계 영역을 나옴
  • S: 세마포어 값 (초기 값만큼 여러 프로세스가 동시 임계 영역 접근 가능)
P(S): wait(S) {
    	while S <= 0  // 대기
        	;
        S--;	// 다른 프로세스 접근 제한
      }
V(S): signal(S) {
        S++;	// 다른 프로세스 접근 허용
      }

세마포어 (Semaphore) - 바쁜 대기

  • wait() 은 S가 0이라면, 임계영역에 들어가기 위해, 반복문 수행
    • 바쁜 대기, busy waiting
P(S): wait(S) {
    	while S <= 0 // 바쁜 대기
        	;
        S--;	// 다른 프로세스 접근 제한
      }

여기서 잠깐

  • 프로그래밍은 근본적으로는 중단이 없음. 끊임없이 코드 실행
    • 중단은 대부분 loop로 표현
    • loop는 CPU에 부하를 걸리게 함

세마포어 (Semaphore) - 대기큐

운영체제 기술로 보완 - 대기큐

  • S가 음수일 경우, 바쁜 대기 대신, 대기큐에 넣는다.
wait(S) {
    S->count--;
    if (S->count < 0) {
    	add this process to S->queue;
        block()
    }
}

세마포어 (Semaphore)

  • wakeup() 함수를 통해 대기큐에 있는 프로세스 재실행
signal(S) {
    S->count++;
    if (S->count <= 0) {
    	remove a process P from S->queue;
        wakeup(P)
    }
}

참고: 주요 세마포어 함수 (POSIX 세마포어)

  • sem_open(): 세마포어를 생성

  • sem_wait(): 임계영역 접근 전, 세마포어를 잠그고, 세마포어가 잠겨있다면, 풀릴 때까지 대기

  • sem_post(): 공유자원에 대한 접근이 끝났을 때 세마포어 잠금을 해제한다.


정리


Thread (스레드)

- 교착상태(Deadlock)와 기아상태(Starvation)


교착상태(deadlock)란?

  • 무한 대기 상태: 두 개 이상의 작업이 서로 상대방의 작업이 끝나기 만을 기다리고 있기 때문에, 다음 단계로 진행하지 못하는 상태
No description has been provided for this image

배치 처리 시스템에서는 일어나지 않는 문제 프로세스, 스레드 둘다 이와 같은 상태가 일어날 수 있음


참고: 교착상태 발생 조건

  • 다음 네 가지 조건이 모두 성립될 때, 교착상태 발생 가능성이 있음
  1. 상호배제(Mutual exclusion): 프로세스들이 필요로 하는 자원에 대해 배타적인 통제권을 요구한다.
  2. 점유대기(Hold and wait): 프로세스가 할당된 자원을 가진 상태에서 다른 자원을 기다린다.
  3. 비선점(No preemption): 프로세스가 어떤 자원의 사용을 끝낼 때까지 그 자원을 뺏을 수 없다.
  4. 순환대기(Circular wait): 각 프로세스는 순환적으로 다음 프로세스가 요구하는 자원을 가지고 있다.

참고: 교착상태 해결 방법

  1. 교착상태 예방
  2. 교착상태 회피
  3. 교착상태 발견
  4. 교착상태 회복

참고: 교착상태 예방(deadlock prevention)

  • 4가지 조건 중 하나를 제거하는 방법
  1. 상호배제 조건의 제거: 임계 영역 제거
  2. 점유와 대기 조건의 제거: 한번에 모든 필요 자원 점유 및 해제
  3. 비선점 조건 제거: 선점 가능 기법을 만들어줌
  4. 순환 대기 조건 제거: 자원 유형에 따라 순서를 매김

참고: 교착상태 회피(deadlock avoidance)

  • 교착상태 조건 1, 2, 3은 놔두고, 4번만 제거
    • 1, 2, 3 제거시, 프로세스 실행 비효율성이 증대
  • 교착상태 조건 중, 자원 할당 순서를 정의하지 않음(순환 대기 조건 제거)
  1. 상호배제 조건의 제거: 임계 영역 제거
  2. 점유와 대기 조건의 제거: 한번에 모든 필요 자원 점유 및 해제
  3. 비선점 조건 제거: 선점 가능 기법을 만들어줌
  4. 순환 대기 조건 제거: 자원 유형에 따라 순서를 매김

참고: 교착상태 발견(deadlock detection)과 회복

  • 교착상태 발견(deadlock detection)
    • 교착상태가 발생했는지 점검하여 교착 상태에 있는

프로세스와 자원을 발견하는 것

  • 교착상태 회복(deadlock recovery)
    • 교착 상태를 일으킨 프로세스를 종료하거나 교착상태의 프로세스에 할당된 자원을 선점하여 프로세스나 자원을 회복하는 것

기아상태(starvation)

  • 특정 프로세스의 우선순위가 낮아서 원하는 자원을 계속 할당 받지 못하는 상태

  • 교착상태와 기아상태

    • 교착상태는 여러 프로세스가 동일 자원 점유를 요청할 때 발생
    • 기아상태는 여러 프로세스가 부족한 자원을 점유하기 위해 경쟁할 때, 특정 프로세스는 영원히 자원 할당이 안되는 경우를 주로 의미함

기아상태 해결 방안

  • 우선순위 변경
    • 프로세스 우선순위를 수시로 변경해서, 각 프로세스가 높은 우선순위를 가질 기회주기
    • 오래 기다린 프로세스의 우선순위를 높여주기
    • 우선순위가 아닌, 요청 순서대로 처리하는 FIFO 기반 요청큐 사용