Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 차원의저주
- 코딩새끼손가락
- 머신러닝기초
- 해석적기울기
- 딥러닝기초
- 컨퓨터비전
- 컴퓨터비전기초
- 그래디언트체크
- 개발자필수단축키
- 보편근사기
- k최근접
- 수치적기울기
- 기계학습도전과제
- 영상분류
- 고려대ai
- 의미적간극
- 벡터와딥러닝
- 알고리즘이해하기
- 딥러닝사례
- 개발단축키
- 백터와행렬
- 코딩손가락
- 컴퓨터비전
- ai융합대학원
- 고유값과ai
- 파이참단축키
- 코딩손가락통증
- KNN
- 인공지능공부
- 고려대딥러닝
Archives
- Today
- Total
Hello New World
[3편] 이미지 분류의 첫걸음, 대표적인 데이터셋 소개 본문
데이터셋은 쉽게 말해, 공부할 자료 모음을 뜻합니다.
예를 들어,
사람이 영어 공부할 때 → 단어장, 문장 모음
AI가 이미지 공부할 때 → 고양이, 개, 자동차 사진 모음
즉, AI가 뭔가를 배우기 위해 보는 예제들의 모음집이 데이터셋입니다.
대표적인 이미지 데이터셋
1. MNIST
- 흑백 손글씨 숫자 이미지 (0~9)
- 28×28 크기의 간단한 이미지
- 초보자용 분류 모델 학습에 자주 사용
2. CIFAR-10 / CIFAR-100
- 32×32 크기의 컬러 이미지
- CIFAR-10: 자동차, 개, 고양이 등 10가지 클래스
- CIFAR-100: 더 세분화된 100가지 클래스
3. ImageNet
- 수백만 장의 고해상도 이미지
- 1000개 이상의 카테고리
- 딥러닝 대회(ILSVRC)와 논문에서 자주 사용
- AlexNet(2012) 모델이 이 데이터로 대박 나면서 딥러닝 붐 시작됨
4. MIT Places
- 풍경/장소 분류용 데이터셋 (예: 교실, 해변, 주방 등)
- 장소(Scene) 인식에 최적화
5. Omniglot
- 다양한 문자(알파벳) 이미지
- 손글씨지만 MNIST보다 훨씬 다양함
- Few-shot learning(적은 데이터 학습) 연구에 자주 사용
'인공지능 > 딥러닝 입문' 카테고리의 다른 글
[5편-1] 선형분류기 : 직선 하나로 고양이와 개를 구분하는 수식 (0) | 2025.04.07 |
---|---|
[4편-2] 비슷한 것은 비슷하게 : k-NN의 깊은 이해 (0) | 2025.03.31 |
[4편-1] 비슷한 것은 비슷하게 : k-NN 알고리즘 (0) | 2025.03.31 |
[2편] 영상 분류의 응용 사례 (0) | 2025.03.25 |
[1편] 영상 분류(Image Classification)의 도전 과제들 (0) | 2025.03.24 |