Hello New World

[3편] 이미지 분류의 첫걸음, 대표적인 데이터셋 소개 본문

인공지능/딥러닝 입문

[3편] 이미지 분류의 첫걸음, 대표적인 데이터셋 소개

Getty J. 2025. 3. 31. 12:17

데이터셋은 쉽게 말해, 공부할 자료 모음을 뜻합니다.

예를 들어,
사람이 영어 공부할 때 → 단어장, 문장 모음
AI가 이미지 공부할 때 → 고양이, 개, 자동차 사진 모음

즉, AI가 뭔가를 배우기 위해 보는 예제들의 모음집이 데이터셋입니다.


대표적인 이미지 데이터셋

1. MNIST

  • 흑백 손글씨 숫자 이미지 (0~9)
  • 28×28 크기의 간단한 이미지
  • 초보자용 분류 모델 학습에 자주 사용


2. CIFAR-10 / CIFAR-100

  • 32×32 크기의 컬러 이미지
  • CIFAR-10: 자동차, 개, 고양이 등 10가지 클래스
  • CIFAR-100: 더 세분화된 100가지 클래스


3. ImageNet

  • 수백만 장의 고해상도 이미지
  • 1000개 이상의 카테고리
  • 딥러닝 대회(ILSVRC)와 논문에서 자주 사용
  • AlexNet(2012) 모델이 이 데이터로 대박 나면서 딥러닝 붐 시작됨


4. MIT Places

  • 풍경/장소 분류용 데이터셋 (예: 교실, 해변, 주방 등)
  • 장소(Scene) 인식에 최적화

5. Omniglot

  • 다양한 문자(알파벳) 이미지
  • 손글씨지만 MNIST보다 훨씬 다양함
  • Few-shot learning(적은 데이터 학습) 연구에 자주 사용