OpenCV 강좌, 경계 검출 후 이미지 후처리

OpenCV는 컴퓨터 비전 분야에서 가장 널리 사용되는 라이브러리 중 하나입니다. 이미지 인식, 비디오 분석, 객체 추적 등 다양한 기능을 제공하며, 이를 통해 강력한 이미지 처리 작업을 수행할 수 있습니다. 본 강좌에서는 OpenCV를 사용하여 이미지에서 경계를 검출한 후, 그 결과를 효과적으로 후처리하는 방법에 대해 알아보겠습니다.

1. 경계 검출이란?

경계 검출은 이미지에서 객체의 경계를 찾는 과정입니다. 이는 객체 인식 및 분할 작업의 핵심으로, 이미지의 특징을 포착하여 고유한 객체를 구분할 수 있게 해줍니다. 대표적인 경계 검출 알고리즘으로는 Canny, Sobel, Laplacian 등이 있습니다.

2. OpenCV 설치하기

먼저, OpenCV를 설치해야 합니다. Python 환경에서 OpenCV를 설치하는 가장 쉬운 방법은 pip를 사용하는 것입니다. 다음 명령어를 사용하여 OpenCV를 설치하십시오:

pip install opencv-python

3. Canny 경계 검출 알고리즘

Canny 경계 검출은 매우 효과적인 경계 검출 기법입니다. 이 알고리즘은 다음의 주요 단계를 따릅니다:

  1. 첫 번째 단계: Gaussian Blur를 사용하여 노이즈 제거
  2. 두 번째 단계: 이미지의 강도를 계산하여 그라디언트Magnitude와 방향을 얻음
  3. 세 번째 단계: 비최대 억제 (Non-maximum Suppression)
  4. 네 번째 단계: 이중 thresholds를 사용하여 경계선 결정

4. Canny 경계 검출 예제

다음은 Canny 경계 검출을 구현한 예제 코드입니다:

import cv2
import numpy as np

# 이미지 로드
image = cv2.imread('image.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Canny 경계 검출
edges = cv2.Canny(gray, 100, 200)

# 결과 표시
cv2.imshow('Original Image', image)
cv2.imshow('Canny Edges', edges)
cv2.waitKey(0)
cv2.destroyAllWindows()

5. 경계 후처리

경계 검출을 한 후, 여러 가지 후처리 작업을 거쳐 결과를 개선할 수 있습니다. 예를 들어, 경계의 두께를 조정하거나 불필요한 노이즈를 제거할 수 있습니다. 일반적인 후처리 기법으로는 모폴로지 변환, 블러링, 윤곽선 추출 등이 있습니다.

6. 모폴로지 변환 (Morphological Transformations)

모폴로지 변환은 이미지의 형태에 대한 처리를 수행합니다. 이 기법은 일반적으로 이진 이미지를 처리하는 데 사용됩니다. 두 가지 주요 형태의 연산은 침식(Erosion)과 팽창(Dilation)입니다.

6.1 침식(Erosion)

침식은 이미지에서 작은 객체를 제거하고 경계를 축소하는 효과를 줍니다.

# 침식
kernel = np.ones((5,5), np.uint8)
eroded = cv2.erode(edges, kernel, iterations = 1)

cv2.imshow('Eroded Image', eroded)
cv2.waitKey(0)
cv2.destroyAllWindows()

6.2 팽창(Dilation)

팽창은 반대로 경계를 확장하고 작은 구멍을 메우는 역할을 합니다.

# 팽창
dilated = cv2.dilate(edges, kernel, iterations = 1)

cv2.imshow('Dilated Image', dilated)
cv2.waitKey(0)
cv2.destroyAllWindows()

7. 블러링 (Blurring)

블러링은 이미지의 세부 정보를 부드럽게 하고 노이즈를 줄이는 데 사용됩니다. Gaussian Blur는 가장 일반적으로 사용되는 블러링 기법입니다.

# Gaussian 블러
blurred = cv2.GaussianBlur(edges, (5, 5), 0)

cv2.imshow('Blurred Image', blurred)
cv2.waitKey(0)
cv2.destroyAllWindows()

8. 윤곽선 추출 (Contour Detection)

윤곽선을 사용하면 이미지에서 객체의 경계를 추출할 수 있습니다. cv2.findContours() 함수를 사용하여 윤곽선을 찾고, cv2.drawContours()를 사용하여 윤곽선을 그릴 수 있습니다.

# 윤곽선 추출
contours, _ = cv2.findContours(edges, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
contour_image = np.zeros_like(image)

cv2.drawContours(contour_image, contours, -1, (0, 255, 0), 2)

cv2.imshow('Contours', contour_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

9. 최종 결과

위의 모든 기법들을 조합하여, 경계 검출 후의 최종 이미지를 생성할 수 있습니다. 예를 들어, Canny로 경계를 검출한 후, 모폴로지 변환을 적용하여 노이즈를 제거하고 윤곽선을 그릴 수 있습니다.

# 경계 검출 + 모폴로지 후처리 + 윤곽선 그리기
edges = cv2.Canny(gray, 100, 200)
dilated = cv2.dilate(edges, kernel, iterations=1)
contours, _ = cv2.findContours(dilated, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

final_image = np.zeros_like(image)
cv2.drawContours(final_image, contours, -1, (0, 255, 0), 2)

cv2.imshow('Final Result', final_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

10. 결론

OpenCV를 사용한 경계 검출과 후처리는 컴퓨터 비전의 핵심 과정입니다. Canny 알고리즘을 통해 경계를 검출한 후, 다양한 후처리 기법을 적용하여 결과를 개선할 수 있습니다. 본 강좌를 통해 OpenCV의 기본적인 경계 검출 기법과 후처리 방법에 대해 익혔기를 바랍니다.

앞으로 더 많은 OpenCV의 기능을 탐구하시고, 실전 프로젝트에 활용해 보시기 바랍니다. Happy Coding!

OpenCV 강좌, 히스토그램 평활화와 명암 보정

안녕하세요! 이번 강좌에서는 OpenCV를 이용한 히스토그램 평활화와 명암 보정에 대해 알아보겠습니다. 이미지 프로세싱에서 히스토그램 평활화는 이미지의 대비를 향상시키기 위한 유용한 기법 중 하나입니다. 이 기술을 통해 이미지의 시각적 품질을 개선할 수 있습니다.

1. 히스토그램이란?

히스토그램은 이미지의 픽셀 값의 분포를 나타내는 그래프입니다. 수평 축은 픽셀의 밝기 값 (0에서 255까지)을 나타내고, 수직 축은 각 밝기 값에 해당하는 픽셀의 수를 나타냅니다.

1.1. 이미지 히스토그램의 중요성

이미지의 히스토그램은 이미지의 밝기 및 대비를 이해하는 데 도움을 줍니다. 예를 들어, 히스토그램이 왼쪽으로 치우쳐져 있다면 이미지가 어두운 것이고, 오른쪽으로 치우쳐져 있으면 이미지가 밝습니다. 따라서, 히스토그램을 분석함으로써 이미지의 품질을 개선할 필요가 있는지 알 수 있습니다.

2. 히스토그램 평활화란?

히스토그램 평활화는 이미지의 대비를 향상시키기 위한 기법입니다. 이 방법은 이미지의 히스토그램을 재구성하여 픽셀 값의 분포를 균등화합니다. 결과적으로, 보다 균일하게 분포된 픽셀 값을 통해 이미지의 시각적 품질이 향상됩니다.

2.1. 히스토그램 평활화를 하는 이유

  • 대비를 향상시켜 세부 정보를 더 잘 보이게 함
  • 어두운 이미지를 밝게 만들고, 밝은 이미지를 고르게 보이도록 함
  • 이미지 분석 및 컴퓨터 비전 기능 향상

3. OpenCV를 이용한 히스토그램 평활화 예제

OpenCV를 사용하여 히스토그램 평활화를 적용하는 방법을 알아보겠습니다. 다음은 파이썬을 이용한 히스토그램 평활화의 코드 예제입니다.

import cv2
import numpy as np
import matplotlib.pyplot as plt

# 이미지를 읽어온다
image = cv2.imread('input_image.jpg', cv2.IMREAD_GRAYSCALE)

# 원본 이미지의 히스토그램을 계산한다
hist_original = cv2.calcHist([image], [0], None, [256], [0, 256])

# 히스토그램 평활화를 진행한다
image_equalized = cv2.equalizeHist(image)

# 평활화된 이미지의 히스토그램을 계산한다
hist_equalized = cv2.calcHist([image_equalized], [0], None, [256], [0, 256])

# 결과를 출력한다
plt.figure(figsize=(12, 6))

plt.subplot(2, 2, 1)
plt.title('Original Image')
plt.imshow(image, cmap='gray')
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Histogram of Original Image')
plt.plot(hist_original)
plt.xlim([0, 256])

plt.subplot(2, 2, 3)
plt.title('Equalized Image')
plt.imshow(image_equalized, cmap='gray')
plt.axis('off')

plt.subplot(2, 2, 4)
plt.title('Histogram of Equalized Image')
plt.plot(hist_equalized)
plt.xlim([0, 256])

plt.tight_layout()
plt.show()

위의 코드를 실행하면, 원본 이미지와 평활화된 이미지를 비교할 수 있으며, 각각에 대한 히스토그램을 시각화할 수 있습니다. 이 과정에서 원본 이미지의 히스토그램은 집중되어 있을 수 있지만, 평활화된 이미지의 히스토그램은 보다 균일하게 분포될 것입니다.

4. 명암 보정 (Contrast Stretching)

명암 보정은 이미지의 명암을 조절하여 이미지의 대비를 개선하는 또 다른 방법입니다. 이 기법은 이미지의 모든 픽셀 값을 특정 범위로 매핑하여 명암을 늘리는 방식으로 작동합니다. 일반적으로 픽셀 값의 범위는 0과 255 사이입니다.

4.1. 명암 보정의 필요성

명암 보정은 이미지의 디테일을 보존하면서 이미지의 명도와 대비를 조절할 수 있어 이미지 분석에 큰 도움이 됩니다. 예를 들어, 의료 이미지, 위성 사진, CCTV 영상 등에서 세부 정보를 강조하고 잘 보이게 하기 위해 사용됩니다.

4.2. OpenCV를 이용한 명암 보정 예제

이제 OpenCV를 사용하여 명암 보정을 수행하는 방법을 알아보겠습니다. 아래 예제는 간단한 명암 보정 방법을 보여줍니다.

# 명암 보정 함수 정의
def contrast_stretching(image):
    # 이미지의 최소 및 최대 픽셀 값 계산
    min_val = np.min(image)
    max_val = np.max(image)

    # 명암 보정 수행
    stretched = ((image - min_val) / (max_val - min_val)) * 255
    return stretched.astype(np.uint8)

# 이미지 읽기
image = cv2.imread('input_image.jpg', cv2.IMREAD_GRAYSCALE)

# 명암 보정 수행
contrast_stretched_image = contrast_stretching(image)

# 결과 화면에 출력
cv2.imshow('Original Image', image)
cv2.imshow('Contrast Stretched Image', contrast_stretched_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

이 예제를 통해 명암 보정 기법을 적용한 후 원본 이미지와 변환된 이미지를 확인할 수 있습니다. 여기서는 픽셀 값의 최소값과 최대값을 이용하여 새로운 범위로 픽셀 값을 재조정합니다.

5. 결론

이번 강좌에서는 OpenCV를 활용한 히스토그램 평활화와 명암 보정에 대해 자세히 알아보았습니다. 이러한 기법들은 이미지의 품질을 개선하고, 세부 정보를 강조하여 다양한 컴퓨터 비전 애플리케이션에 활용될 수 있습니다. 다양한 이미지를 가지고 실험하면서 각 기법의 효과를 직접 확인해보시기 바랍니다.

읽어주셔서 감사합니다! 더 많은 OpenCV 관련 내용이 궁금하신 분들은 댓글로 질문해주시면 성심껏 답변해드리겠습니다.

OpenCV 강좌, 다양한 이미지 파일 형식 (JPEG, PNG 등) 불러오기

OpenCV (Open Source Computer Vision Library)는 컴퓨터 비전과 머신 러닝 분야에서 널리 사용되는 오픈 소스 라이브러리입니다. 이 강좌에서는 OpenCV를 사용하여 다양한 이미지 파일 형식(JPEG, PNG 등)을 불러오는 방법에 대해 다루겠습니다. 이 과정에서 우리는 이미지 파일을 읽고, 표시하며, 기본적인 처리 작업을 수행하는 방법을 배울 것입니다.

1. OpenCV 소개

OpenCV는 이미지와 비디오를 처리하는 강력한 도구입니다. C++, Python, Java와 같은 다양한 프로그래밍 언어에서 사용할 수 있습니다. OpenCV는 이미지 처리, 객체 탐지, 얼굴 인식, 캡처 및 영상 분석과 같은 다양한 기능을 제공합니다.

2. 환경 설정

OpenCV를 사용하기 위해서는 먼저 필요한 라이브러리를 설치해야 합니다. Python에서 OpenCV를 설치하기 위해서는 pip를 사용할 수 있습니다.

pip install opencv-python

설치가 완료되면, 다음과 같이 OpenCV를 임포트하여 사용할 준비를 합니다:

import cv2

3. 이미지 파일 불러오기

OpenCV는 다양한 이미지 파일 형식을 지원하며, 가장 일반적으로 사용되는 형식은 JPEG, PNG, BMP 등입니다. 이 섹션에서는 OpenCV를 사용하여 이러한 이미지 파일을 불러오는 방법을 알아보겠습니다.

3.1 이미지 파일 불러오기 기본

OpenCV에서는 cv2.imread() 함수를 사용하여 이미지를 불러올 수 있습니다. 이 함수는 파일 경로와 함께 이미지를 읽어서 NumPy 배열로 반환합니다.

구문:

image = cv2.imread('file_path', flags)
  • file_path: 읽어올 이미지 파일의 경로
  • flags: 이미지 읽기 모드를 지정합니다. (예: cv2.IMREAD_COLOR, cv2.IMREAD_GRAYSCALE)

예제 코드:

import cv2

# JPEG 이미지 불러오기
image_jpeg = cv2.imread('image.jpeg', cv2.IMREAD_COLOR)

# PNG 이미지 불러오기
image_png = cv2.imread('image.png', cv2.IMREAD_COLOR)

# 이미지가 불러와졌는지 확인
if image_jpeg is not None:
    print('JPEG 이미지가 성공적으로 불러와졌습니다.')
else:
    print('JPEG 이미지를 불러오는데 실패했습니다.')

if image_png is not None:
    print('PNG 이미지가 성공적으로 불러와졌습니다.')
else:
    print('PNG 이미지를 불러오는데 실패했습니다.')  

3.2 다양한 파일 형식 지원

OpenCV는 여러 가지 이미지 파일 형식을 지원합니다. 각 파일 형식에 대한 특징과 OpenCV의 지원 여부를 간략하게 살펴보겠습니다.

  • JPEG: 손실 압축 방식으로 이미지 품질이 좋고 일반적으로 사용됩니다.
  • PNG: 무손실 압축 방식으로 투명도를 지원합니다.
  • BMP: 비압축 이미지 포맷으로 고품질 이미지를 유지합니다.
  • TIFF: 고해상도 이미지를 저장하는 데 적합하며, 다양한 압축 방식을 지원합니다.

예제 코드:

formats = ['image.jpeg', 'image.png', 'image.bmp', 'image.tiff']

for format_file in formats:
    image = cv2.imread(format_file, cv2.IMREAD_COLOR)
    if image is not None:
        print(f'{format_file} 파일이 성공적으로 불러와졌습니다.')
    else:
        print(f'{format_file} 파일을 불러오는데 실패했습니다.')  

4. 이미지 표시하기

불러온 이미지는 OpenCV의 cv2.imshow() 함수를 사용하여 화면에 표시할 수 있습니다.

구문:

cv2.imshow('window_name', image)

여기서 window_name는 나타낼 창의 이름입니다. 이미지를 표시한 후에는 cv2.waitKey() 함수를 사용하여 키 입력을 기다리고, cv2.destroyAllWindows()를 사용하여 모든 창을 닫을 수 있습니다.

예제 코드:

import cv2

# 이미지 불러오기
image = cv2.imread('image.png', cv2.IMREAD_COLOR)

# 이미지 표시하기
cv2.imshow('이것은 PNG 이미지입니다', image)

# 키 입력을 기다립니다.
cv2.waitKey(0)

# 모든 창을 닫습니다.
cv2.destroyAllWindows()  

5. 이미지 처리 및 변환

불러온 이미지를 이용하여 다양한 처리 작업을 수행할 수 있습니다. 대표적으로 이미지 크기 조정, 색상 변환, 필터 적용 등이 있습니다.

5.1 이미지 크기 조정

OpenCV에서는 cv2.resize() 함수를 사용하여 이미지의 크기를 조정할 수 있습니다.

구문:

resized_image = cv2.resize(image, dsize, interpolation)
  • dsize: 결과 이미지의 크기를 설정합니다.
  • interpolation: 크기 조정 시 사용할 보간 방법을 지정합니다. (예: cv2.INTER_LINEAR, cv2.INTER_CUBIC)

예제 코드:

# 이미지 불러오기
image = cv2.imread('image.jpeg', cv2.IMREAD_COLOR)

# 이미지 크기 조정
resized_image = cv2.resize(image, (500, 500), interpolation=cv2.INTER_LINEAR)

# 크기 조정된 이미지 표시
cv2.imshow('Resized Image', resized_image)
cv2.waitKey(0)
cv2.destroyAllWindows()  

5.2 색상 변환

OpenCV에서는 색상 공간을 변환할 수 있습니다. 예를 들어, RGB 이미지를 그레이스케일로 변환할 수 있습니다.

구문:

gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

예제 코드:

# 이미지 불러오기
image = cv2.imread('image.jpg', cv2.IMREAD_COLOR)

# 색상 변환
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 그레이스케일 이미지 표시
cv2.imshow('Gray Image', gray_image)
cv2.waitKey(0)
cv2.destroyAllWindows()  

6. 결론

이번 강좌에서는 OpenCV를 사용하여 다양한 이미지 파일 형식(JPEG, PNG 등)을 불러오고, 이를 처리하는 기본적인 방법을 알아보았습니다. OpenCV는 강력한 이미지 처리 라이브러리로, 이 외에도 많은 기능을 제공합니다. 다음 강좌에서는 이미지 필터링, 윤곽선 검출, 그리고 객체 탐지 방법에 대해 알아보겠습니다.

참고 자료

OpenCV 강좌, 외곽선 활용한 도형 인식과 라벨링

OpenCV(Open Source Computer Vision Library)는 컴퓨터 비전 관련 작업을 용이하게 수행하기 위해 설계된 라이브러리입니다. 본 강좌에서는 OpenCV를 사용하여 이미지를 처리하고 도형을 인식하며 이를 라벨링하는 방법에 대해 다루겠습니다. 외곽선 추출 방법과 도형 인식 기술을 통해 다양한 도형을 자동으로 식별할 수 있습니다. 이 글에서는 주로 Python을 사용하여 설명하겠습니다.

목차

1. OpenCV 소개

OpenCV는 2000년에 인텔에서 처음 개발된 라이브러리로, 오늘날 데이터 분석과 머신러닝을 포함한 다양한 분야에서 널리 사용되고 있습니다. 이미지와 비디오 처리 작업을 수행하는 데 강력한 도구를 제공하여 연구 및 상용 제품에 활용되고 있습니다. OpenCV는 C++, Python, Java 등 여러 프로그래밍 언어를 지원합니다.

2. 환경 설정

OpenCV를 사용하기 위해서는 먼저 Python 환경을 설정해야 합니다. 다음은 필요한 패키지 설치 방법입니다.

pip install opencv-python
pip install opencv-python-headless
pip install numpy

설치가 완료되면, 기본적인 OpenCV 기능을 사용할 준비가 완료됩니다.

3. 기본 개념

도형 인식 및 라벨링을 설명하기 위해, 몇 가지 기본 알고리즘과 개념을 이해해야 합니다. 우리는 외곽선 추출(contour extraction), 도형의 형태(circular, rectangular), 그리고 라벨링(Labeling) 과정에 대해 다룰 것입니다.

3.1 외곽선 (Contour)

외곽선이란 2D 이미지에서 피사체를 정의하는 경계선입니다. OpenCV에서는 cv2.findContours() 함수를 통해 처리할 수 있습니다.

3.2 도형 인식

도형 인식은 특히 면적과 외곽선을 기반으로 도형을 분류하는 작업입니다. 일반적으로 원, 사각형, 다각형 등을 인식하는 데 사용됩니다.

3.3 라벨링

라벨링이란 인식된 도형에 이름을 붙이는 과정입니다. 생성된 외곽선 정보를 바탕으로 각 도형에 의해 이름 붙여지는 프로세스입니다.

4. 외곽선 추출

이제 OpenCV를 활용하여 이미지를 불러오고 외곽선을 추출하는 방법을 알아보겠습니다. 함수를 사용하여 이미지를 전처리한 후 외곽선을 찾을 수 있습니다. 예제 코드입니다.

import cv2
import numpy as np

# 이미지 읽기
image = cv2.imread('shapes.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 경계 검출을 위한 바이너리 이미지로 변환
_, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)

# 외곽선 찾기
contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 외곽선 그리기
cv2.drawContours(image, contours, -1, (0, 255, 0), 2)

# 결과 표시
cv2.imshow('Contours', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

이 코드는 입력 이미지에서 외곽선을 검출하고 이를 녹색으로 강조하여 표시합니다. cv2.threshold() 를 사용하여 이미지를 이진화한 후, cv2.findContours()를 호출하여 외곽선을 찾습니다.

5. 도형 인식

외곽선이 추출된 후, 각 도형의 형태를 분석하여 인식할 수 있습니다. 아래 코드는 각 외곽선의 형태를 식별하고 이에 따라 도형의 이름을 출력하는 방법을 보여줍니다.

for contour in contours:
    # 외곽선의 면적
    area = cv2.contourArea(contour)

    # 작은 외곽선 무시
    if area < 100:
        continue

    # 외곽선을 근사하여 도형의 꼭짓점 수 계산
    epsilon = 0.02 * cv2.arcLength(contour, True)
    approx = cv2.approxPolyDP(contour, epsilon, True)

    # 도형 인식
    if len(approx) == 3:
        cv2.putText(image, 'Triangle', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 4:
        # 면적비율로 사각형인지 확인
        x, y, w, h = cv2.boundingRect(contour)
        aspectRatio = float(w) / h
        if aspectRatio >= 0.95 and aspectRatio <= 1.05:
            cv2.putText(image, 'Square', (x, y), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
        else:
            cv2.putText(image, 'Rectangle', (x, y), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 5:
        cv2.putText(image, 'Pentagon', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 6:
        cv2.putText(image, 'Hexagon', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    else:
        cv2.putText(image, 'Circle', (int(contour[0][0][0]), int(contour[0][0][1])), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

이 코드는 각 도형을 외곽선의 꼭짓점 수와 면적 비율을 바탕으로 식별합니다. 삼각형, 사각형, 원 등의 도형을 인식하고 해당 이름을 이미지에 추가하여 표시합니다.

6. 라벨링

라벨링 작업은 인식된 도형에 대한 정보를 사용자가 이해할 수 있는 형태로 표현하는 것입니다. 우리는 각 도형의 위치와 형태를 기반으로 이름을 붙였습니다. 위의 코드에서도 이미지를 표시할 때 도형 이름을 적어줌으로써 라벨링을 수행했습니다.

7. 실제 코드 예제

전체 코드를 하나로 묶으면 다음과 같습니다. 주어진 이미지에서 도형을 인식하고 라벨링하는 전체적인 프로세스를 구현하였습니다.

import cv2
import numpy as np

# 이미지 읽기
image = cv2.imread('shapes.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 이진화
_, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
contours, _ = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

for contour in contours:
    area = cv2.contourArea(contour)
    if area < 100:
        continue
    epsilon = 0.02 * cv2.arcLength(contour, True)
    approx = cv2.approxPolyDP(contour, epsilon, True)
    
    # 도형 인식 및 라벨링
    if len(approx) == 3:
        cv2.putText(image, 'Triangle', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 4:
        x, y, w, h = cv2.boundingRect(contour)
        aspectRatio = float(w) / h
        if aspectRatio >= 0.95 and aspectRatio <= 1.05:
            cv2.putText(image, 'Square', (x, y), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
        else:
            cv2.putText(image, 'Rectangle', (x, y), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 5:
        cv2.putText(image, 'Pentagon', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    elif len(approx) == 6:
        cv2.putText(image, 'Hexagon', tuple(approx[0][0]), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)
    else:
        cv2.putText(image, 'Circle', (int(contour[0][0][0]), int(contour[0][0][1])), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 0, 0), 2)

# 결과 표시
cv2.imshow('Shapes', image)
cv2.waitKey(0)
cv2.destroyAllWindows()

8. 결론

이번 강좌에서는 OpenCV를 이용하여 외곽선을 추출하고 도형을 인식하며 라벨링하는 방법을 살펴보았습니다. OpenCV의 다양한 기능을 활용하여 더욱 복잡한 이미지 처리와 분석 작업을 수행할 수 있습니다. 앞으로 더 많은 예제와 기술을 통해 여러분의 컴퓨터 비전 지식을 확장해 나가기를 바랍니다.

자세한 내용은 OpenCV의 공식 문서 및 커뮤니티 자료를 참조하시기 바랍니다.

감사합니다.

OpenCV 강좌, 카메라 왜곡 보정과 캘리브레이션

안녕하세요! 이번 강좌에서는 OpenCV를 활용하여 카메라 왜곡을 보정하는 방법과 카메라 캘리브레이션에 대해 자세히 알아보겠습니다. 컴퓨터 비전 분야에서 카메라 보정은 다양한 응용프로그램에서 중요한 역할을 합니다. 다채로운 이미지를 정확하게 처리하기 위해서는 왜곡된 이미지를 올바르게 보정할 필요가 있습니다. 그럼 이 과정을 시작해보겠습니다.

1. 카메라 왜곡 개념

카메라 왜곡은 물체의 이미지를 왜곡시키는 여러 요인으로 인해 발생합니다. 이 요인은 다음과 같습니다:

  • 렌즈 왜곡: 주로 볼록 렌즈나 오목 렌즈의 사용으로 인해 발생합니다. 이러한 왜곡은 실물의 모양을 변형시키고, 이는 대칭적이지 않은 형태를 만들어냅니다.
  • 소실점 효과: 이미지를 생성할 때, 다양한 각도와 거리에서 물체가 표현되기 때문에 소실점 효과가 발생할 수 있습니다.
  • 카메라와 물체 간의 거리: 카메라가 물체와 얼마나 멀리 떨어져 있는지에 따라 왜곡 정도가 달라질 수 있습니다.

2. 카메라 왜곡 보정의 필요성

카메라 왜곡을 보정하는 것은 여러 가지 컴퓨터 비전 작업에서 필수적입니다. 이를 통해 우리가 바라는 이미지의 정확한 형태를 얻을 수 있습니다.

  • 측정 정확도 향상: 왜곡이 있는 이미지를 사용하여 물체의 크기나 거리 등을 측정하기 어려울 수 있습니다. 보정을 통해 측정의 정확도를 높일 수 있습니다.
  • 정확한 이미지 분석: 객체 인식, 이미지 스티칭, 3D 재구성 등에서는 왜곡된 이미지를 사용하면 결과에 영향을 줄 수 있습니다.
  • 시각적 품질 향상: 특히 게임, 영화 제작 등의 분야에서는 시각적 품질이 중요합니다. 왜곡을 보정하여 보다 자연스럽고 매끄러운 이미지를 만들어낼 수 있습니다.

3. OpenCV를 이용한 카메라 캘리브레이션

카메라 캘리브레이션은 카메라의 내부 파라미터와 외부 파라미터를 계산하여 왜곡을 보정하는 과정입니다. OpenCV에서는 이 과정을 수행하기 위한 다양한 함수를 제공하고 있습니다.

3.1. 카메라 캘리브레이션을 위한 준비

먼저, 카메라 캘리브레이션을 위해 장치, 촬영할 이미지, 그리고 체스보드 패턴이 필요합니다. 체스보드 패턴은 코너 포인트를 찾는데 도움을 주며, 다음과 같은 규칙에 따라 만들어질 수 있습니다:

  • 검정과 흰색이 번갈아 가며 배열된 정사각형으로 이루어져야 합니다.
  • 정사각형의 크기는 일관되게 유지해야 하며, 각 정사각형의 크기는 캘리브레이션 후 조정할 파라미터를 위한 기준으로 사용됩니다.

3.2. 캘리브레이션 과정

  1. 체스보드 이미지를 여러 장 촬영합니다. 각 이미지는 서로 다른 각도와 위치에서 촬영해야 합니다.
  2. 촬영한 이미지를 통해 코너 포인트를 찾아냅니다.
  3. 찾은 코너 포인트를 이용해 카메라의 내부 및 외부 파라미터를 계산합니다.
  4. 계산된 파라미터를 사용하여 이미지 왜곡을 보정합니다.

3.3. OpenCV 코드 예제

아래는 Python과 OpenCV를 사용하여 카메라 캘리브레이션을 수행하는 간단한 예제 코드입니다.

import numpy as np
import cv2
import glob

# 체스보드 내의 정사각형 수
CHECKERBOARD = (7, 6)

# 3D 포인트와 2D 포인트 저장
objp = np.zeros((CHECKERBOARD[0] * CHECKERBOARD[1], 3), np.float32)
objp[:, :2] = np.mgrid[0:CHECKERBOARD[0], 0:CHECKERBOARD[1]].T.reshape(-1, 2)

# 3D 포인트 및 2D 포인트를 담을 리스트 설정
objpoints = []  # 3D 포인트
imgpoints = []  # 2D 포인트

# 이미지 파일을 찾는다
images = glob.glob('path/to/your/images/*.jpg')

# 각 이미지에 대해 반복
for fname in images:
    img = cv2.imread(fname)
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 코너 찾기
    ret, corners = cv2.findChessboardCorners(gray, CHECKERBOARD, None)

    # 코너가 발견되었다면
    if ret:
        objpoints.append(objp)
        imgpoints.append(corners)

# 카메라 보정
ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1], None, None)

# 보정된 이미지 저장하기
img = cv2.imread('path/to/your/test/image.jpg')
dst = cv2.undistort(img, mtx, dist, None, mtx)

cv2.imwrite('calibrated_image.jpg', dst)

print("카메라 보정 완료! 보정된 이미지를 확인해주세요.")

4. 카메라 왜곡 보정 결과 확인하기

위의 코드에서 우리는 카메라 모델(mtx)과 왜곡 계수(dist)를 구한 후, cv2.undistort() 함수를 사용하여 원본 이미지를 보정했습니다. 보정 작업이 완료되면, 결과 이미지를 확인하여 왜곡이 얼마나 잘 보정되었는지 살펴보십시오. 또한, 왜곡이 있는 원본 이미지와 비교하여 어떤 변화가 있었는지를 확인하는 것이 좋습니다.

4.1. 왜곡 전후 이미지 비교

아래는 왜곡 전후 이미지를 비교하는 방법을 나타내는 코드입니다.

import matplotlib.pyplot as plt

# 이미지를 표시합니다
original_image = cv2.imread('path/to/your/test/image.jpg')
calibrated_image = cv2.imread('calibrated_image.jpg')

# 이미지를 표시
plt.subplot(1, 2, 1)
plt.title('Before Correction')
plt.imshow(cv2.cvtColor(original_image, cv2.COLOR_BGR2RGB))

plt.subplot(1, 2, 2)
plt.title('After Correction')
plt.imshow(cv2.cvtColor(calibrated_image, cv2.COLOR_BGR2RGB))

plt.show()

5. 결론

이번 강좌를 통해 OpenCV를 사용하여 카메라 왜곡 보정과 캘리브레이션의 기본 개념과 방법을 익히셨기를 바랍니다. 카메라 캘리브레이션은 실제 컴퓨터 비전 프로젝트에서 매우 중요한 절차이며, 왜곡이 없는 정확한 이미지를 얻기 위해 필수적입니다.

OpenCV는 이 과정을 간편하게 수행할 수 있는 훌륭한 도구입니다. 앞으로도 OpenCV를 활용하여 다양한 컴퓨터 비전 응용 프로그램을 개발하시기 바랍니다. 질문이 있으시면 댓글로 남겨주세요!