Python의 멀티스레딩

Python의 멀티스레딩

이 문서에서는 Python 프로그래밍 언어의 멀티스레딩에 대한 기본 사항을 다룹니다. 멀티프로세싱 과 마찬가지로 멀티스레딩도 멀티태스킹을 달성하는 방법입니다. 멀티스레딩에서는 스레드 개념이 사용됩니다. 먼저 컴퓨터 아키텍처에서 스레드 의 개념을 이해해 보겠습니다 .

Python의 프로세스란 무엇입니까?

컴퓨팅에서 프로세스는 실행 중인 컴퓨터 프로그램의 인스턴스입니다. 모든 프로세스에는 3가지 기본 구성요소가 있습니다.

  • 실행 가능한 프로그램입니다.
  • 프로그램에 필요한 관련 데이터(변수, 작업 공간, 버퍼 등)
  • 프로그램의 실행 컨텍스트(프로세스 상태)

Python 스레딩 소개

스레드  실행을 예약할 수 있는 프로세스 내의 엔터티입니다. 또한 OS(운영체제)에서 수행할 수 있는 가장 작은 처리 단위이다. 간단히 말해서, 스레드는 다른 코드와 독립적으로 실행될 수 있는 프로그램 내 명령의 시퀀스입니다. 단순화를 위해 스레드는 단순히 프로세스의 하위 집합이라고 가정할 수 있습니다. 스레드는 스레드 제어 블록 (TCB) 에 이 모든 정보를 포함합니다 .

  • 스레드 식별자: 고유 ID(TID)가 모든 새 스레드에 할당됩니다.
  • 스택 포인터: 프로세스의 스레드 스택을 가리킵니다. 스택에는 스레드 범위 아래의 지역 변수가 포함되어 있습니다.
  • 프로그램 카운터: 현재 스레드가 실행 중인 명령어의 주소를 저장하는 레지스터입니다.
  • 스레드 상태: 실행 중, 준비 중, 대기 중, 시작 중 또는 완료일 수 있습니다.
  • 스레드의 레지스터 세트: 계산을 위해 스레드에 할당된 레지스터입니다.
  • 상위 프로세스 포인터: 스레드가 있는 프로세스의 프로세스 제어 블록(PCB)에 대한 포인터입니다.

멀티스레딩을 구현하는 방법을 이해하면 I/O 바인딩 및 특정 유형의 네트워크 애플리케이션의 성능을 크게 향상시킬 수 있습니다. 그러나 이 개념을 익히려면 Python의 일부 고급 기능에 대한 명확한 이해가 필요합니다. 이러한 기술을 더욱 발전시키려는 사람들을 위해 무료 Python 코스에는 멀티스레딩 전용 모듈이 포함되어 있습니다.

프로세스와 스레드 간의 관계를 이해하려면 아래 다이어그램을 고려하십시오.

프로세스와 스레드 간의 관계

다음과 같은 경우 하나의 프로세스 내에 여러 스레드가 존재할 수 있습니다.

  • 각 스레드에는 자체 레지스터 세트 와 로컬 변수(스택에 저장됨)가 포함되어 있습니다 .
  • 프로세스의 모든 스레드는 전역 변수(힙에 저장됨) 와 프로그램 코드를 공유합니다 .

메모리에 여러 스레드가 존재하는 방식을 이해하려면 아래 다이어그램을 고려하십시오.

메모리에 다중 스레드 존재

Python의 스레딩 소개

멀티스레딩은 여러 스레드를 동시에 실행하는 프로세서의 기능으로 정의됩니다. 간단한 단일 코어 CPU에서는 스레드 간 빈번한 전환을 사용하여 달성됩니다. 이를 컨텍스트 전환 이라고 합니다 . 컨텍스트 전환에서는 인터럽트(I/O 또는 수동 설정으로 인해)가 발생할 때마다 스레드의 상태가 저장되고 다른 스레드의 상태가 로드됩니다. 컨텍스트 전환이 너무 자주 발생하여 모든 스레드가 병렬로 실행되는 것처럼 보입니다(이를 멀티태스킹 이라고 함 ).

프로세스에 두 개의 활성 스레드가 포함되어 있는 아래 다이어그램을 살펴보세요. 

멀티스레딩

Python의 멀티스레딩

Python 에서 스레딩 모듈  프로그램에서 여러 스레드를 생성하기 위한 매우 간단하고 직관적인 API를 제공합니다. 멀티스레딩 코드를 단계별로 이해해 보겠습니다.

1단계: 모듈 가져오기

먼저 스레딩 모듈을 가져옵니다.

import threading

2단계: 스레드 생성

새로운 스레드를 생성하기 위해 Thread 클래스 의 객체를 생성합니다 . 매개변수로 ‘target’과 ‘args’를 사용합니다. 대상  스레드에 의해 실행될 함수이고 args 는 대상 함수에 전달될 인수 입니다 .

t1 = threading.Thread(target, args)
t2 = threading.Thread(target, args)

3단계: 스레드 시작

스레드를 시작하려면 Thread 클래스의 start() 메서드를 사용합니다.

t1.start()
t2.start()

4단계: 스레드 실행 종료

스레드가 시작되면 현재 프로그램(메인 스레드처럼 생각할 수 있음)도 계속 실행됩니다. 스레드가 완료될 때까지 현재 프로그램의 실행을 중지하려면 Join() 메서드를 사용합니다.

t1.join()
t2.join()

결과적으로 현재 프로그램은 먼저 t1 이 완료될 때까지 기다린 다음 t2가 완료될 때까지 기다립니다 . 작업이 완료되면 현재 프로그램의 나머지 명령문이 실행됩니다.

예:

스레딩 모듈을 사용하는 간단한 예를 살펴보겠습니다.

이 코드는 Python의 스레딩 모듈을 사용하여 숫자의 제곱과 세제곱을 동시에 계산하는 방법을 보여줍니다. 이러한 계산을 수행하기 위해 두 개의 스레드 및 가 생성됩니다. 시작되고 결과는 프로그램이 “완료!”를 인쇄하기 전에 병렬로 인쇄됩니다. 두 스레드가 모두 완료되면. 스레딩은 계산 집약적인 작업을 처리할 때 병렬성을 달성하고 프로그램 성능을 향상시키는 데 사용됩니다. t1 t2

파이썬

import threading


def print_cube(num):
    print("Cube: {}" .format(num * num * num))


def print_square(num):
    print("Square: {}" .format(num * num))


if __name__ =="__main__":
    t1 = threading.Thread(target=print_square, args=(10,))
    t2 = threading.Thread(target=print_cube, args=(10,))

    t1.start()
    t2.start()

    t1.join()
    t2.join()

    print("Done!")

출력

Square: 100
Cube: 1000
Done!

출력:

Square: 100
Cube: 1000
Done!

위 프로그램의 작동 방식을 더 잘 이해하려면 아래 다이어그램을 고려하십시오. 

멀티스레딩

예:

이 예에서는 os.getpid() 함수를 사용하여 현재 프로세스의 ID를 가져옵니다. threading.main_thread() 함수를 사용하여 메인 스레드 객체를 가져옵니다. 정상적인 조건에서 메인 스레드는 Python 인터프리터가 시작된 스레드입니다. 스레드 객체의 name 속성은 스레드의 이름을 가져오는 데 사용됩니다. 그런 다음 threading.current_thread() 함수를 사용하여 현재 스레드 객체를 가져옵니다.

각 작업에 대한 스레드 이름과 해당 프로세스를 인쇄하는 아래 Python 프로그램을 고려하십시오. 

이 코드는 Python의 스레딩 모듈을 사용하여 두 작업을 동시에 실행하는 방법을 보여줍니다. 기본 프로그램은 두 개의 스레드를 시작 하고 각각은 특정 작업을 실행합니다. 스레드는 병렬로 실행되며 코드는 프로세스 ID 및 스레드 이름에 대한 정보를 제공합니다. 모듈 은 프로세스 ID에 액세스하는 데 사용되며  모듈은 스레드와 스레드 실행을 관리하는 데 사용됩니다. t1 t2osthreading’

파이썬

import threading
import os

def task1():
    print("Task 1 assigned to thread: {}".format(threading.current_thread().name))
    print("ID of process running task 1: {}".format(os.getpid()))

def task2():
    print("Task 2 assigned to thread: {}".format(threading.current_thread().name))
    print("ID of process running task 2: {}".format(os.getpid()))

if __name__ == "__main__":

    print("ID of process running main program: {}".format(os.getpid()))

    print("Main thread name: {}".format(threading.current_thread().name))

    t1 = threading.Thread(target=task1, name='t1')
    t2 = threading.Thread(target=task2, name='t2')

    t1.start()
    t2.start()

    t1.join()
    t2.join()

출력

ID of process running main program: 19
Main thread name: MainThread
Task 1 assigned to thread: t1
ID of process running task 1: 19
Task 2 assigned to thread: t2
ID of process running task 2: 19

출력:

ID of process running main program: 1141
Main thread name: MainThread
Task 1 assigned to thread: t1
ID of process running task 1: 1141
Task 2 assigned to thread: t2
ID of process running task 2: 1141

아래에 주어진 다이어그램은 위의 개념을 명확하게 합니다.

멀티스레딩

이상으로 Python의 멀티스레딩에 대해 간략하게 소개했습니다. 이 시리즈의 다음 기사에서는 여러 스레드 간의 동기화를 다룹니다 . Python의 멀티스레딩 | 세트 2(동기화) 

파이썬 스레드풀

스레드 풀은 미리 생성되어 여러 작업을 실행하는 데 재사용할 수 있는 스레드 모음입니다. Python의 Concurrent.futures 모듈은 스레드 풀을 쉽게 생성하고 관리할 수 있게 해주는 ThreadPoolExecutor 클래스를 제공합니다. 

이 예에서는 스레드에서 실행될 함수 작업자를 정의합니다. 최대 2개의 작업자 스레드로 ThreadPoolExecutor를 생성합니다. 그런 다음 submit 메소드를 사용하여 두 개의 작업을 풀에 제출합니다. 풀은 작업자 스레드의 작업 실행을 관리합니다. 메인 스레드가 계속되기 전에 모든 작업이 완료될 때까지 기다리기 위해 shutdown 메서드를 사용합니다.

멀티스레딩은 프로그램의 효율성과 반응성을 높이는 데 도움이 됩니다. 그러나 경쟁 조건 및 교착 상태와 같은 문제를 방지하려면 스레드로 작업할 때 주의하는 것이 중요합니다.

이 코드는 에서 생성된 스레드 풀을 사용하여 두 개의 작업자 작업을 동시에 실행합니다. 메인 스레드는 작업자 스레드가 . 이를 통해 다중 스레드 환경에서 작업을 효율적으로 병렬 처리할 수 있습니다. concurrent.futures.ThreadPoolExecutorpool.shutdown(wait=True)

파이썬

import concurrent.futures

def worker():
    print("Worker thread running")

pool = concurrent.futures.ThreadPoolExecutor(max_workers=2)

pool.submit(worker)
pool.submit(worker)

pool.shutdown(wait=True)

print("Main thread continuing to run")

출력

Worker thread running
Worker thread running
Main thread continuing to run

Python의 멀티스레딩 – FAQ

Python의 멀티스레딩이란 무엇입니까?

Python의 멀티스레딩에는 단일 프로세스 내에서 여러 스레드를 동시에 실행하여 병렬성을 달성하고 여러 CPU 코어를 활용하는 작업이 포함됩니다 .

Python이 멀티스레딩에 적합합니까?

Python은 CPU 바인딩 작업에 대해 한 번에 하나의 스레드만 실행하도록 제한하는 GIL(Global Interpreter Lock) 덕분에 멀티스레딩을 사용하는 I/O 바인딩 작업 에 적합합니다 . CPU 바인딩된 작업의 경우 다중 처리가 더 효과적인 경우가 많습니다.

Python에서 멀티스레딩에 사용되는 모듈은 무엇입니까?

‘ threading’ 모듈은 Python에서 멀티스레딩에 사용됩니다.

Python의 다양한 스레드 유형은 무엇입니까?

Python의 두 가지 주요 스레드 유형은 다음과 같습니다.

  • Main Thread : 프로그램이 시작될 때 실행되는 초기 스레드입니다.
  • 데몬 스레드 : 메인 스레드가 종료되면 자동으로 종료되는 백그라운드 스레드입니다.
  • Non-Daemon Threads : 메인 스레드가 종료되더라도 작업이 완료될 때까지 계속 실행되는 스레드입니다.

Python 멀티스레딩은 몇 개의 스레드를 가질 수 있습니까?

Python의 스레드 수에는 고정된 제한이 없지만 실제 제한은 시스템 리소스와 GIL에 의해 결정되므로 스레드 수가 많으면 성능이 저하될 수 있습니다. 일반적으로 Python 애플리케이션은 수십에서 수백 개의 스레드를 사용하지만 집약적인 작업의 경우 다중 처리를 사용하는 것이 좋습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다