Hello New World

[1편] 영상 분류(Image Classification)의 도전 과제들 본문

인공지능/딥러닝 입문

[1편] 영상 분류(Image Classification)의 도전 과제들

Getty J. 2025. 3. 24. 21:44

의미적 간극(Semantic Gap)

  • 사람은 사진을 보면 "강아지", "자동차"처럼 바로 알아봄
  • 컴퓨터는 사진을 그냥 숫자들(색깔 정보)로만 봄
      ▶ 그래서 컴퓨터가 이미지를 이해하기란 어려운 일이고, 이 차이를 의미적 간극이라고 합니다.

영상 분류의 구체적인 도전 과제들

1. Viewpoint Variation (관점 변화)
  - 카메라 각도가 바뀌면, 같은 물체도 완전히 다른 모습처럼 보이는 문제

2. Intraclass Variation (클래스 내 다양성)
  - 같은 '개(클래스)'라도 생김새 다르기 때문에 컴퓨터가 하나로 인식하기 어려운 문제.

3. Fine-Grained Categories (세밀한 구분)
  - 매우 유사한 종류들을 구분해야 하는 경우
  - 예: 메인쿤, 랙돌, 아메리칸 숏헤어 등 고양이 품종 구분하기

4. Background Clutter (배경의 복잡함)
  - 물체가 복잡한 배경 위에 있으면 물체 자체를 식별하기 어려

5. Illumination Changes (조명 변화)
  - 같은 물체도 빛의 세기나 방향에 따라 색과 모양이 달라짐
  - 밝기, 그림자, 반사 등이 픽셀 값을 크게 변화시킵니다.

6. Deformation (형태 변화)
  - 같은 물체라도 자세에 따라 이미지가 크게 달라짐

7. Occlusion (가려짐)
  - 일부만 보이는 물체를 식별해야 하는 어려움


퀴즈

1. 조명이 바뀌면 같은 물체라도 색과 모양이 달라 보여, 컴퓨터가 인식하기 어렵다.
👉 ✅ O

2. 카메라 각도가 달라져도 컴퓨터는 항상 같은 물체로 정확히 인식할 수 있다.
👉 ❌ X (관점 변화는 인식에 큰 도전 과제)

3. 복잡한 배경이 있을 경우, 컴퓨터는 물체를 더 쉽게 구분할 수 있다.
👉 ❌ X (배경이 복잡하면 더 어려워)