[DL] CNN (Convolutional Neural Network)

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

CNN 이란?

데이터로부터 직접 학습하는 딥러닝의 신경망 아키텍쳐

영상, 객체, 클래스, 범주인식을 위한 패턴을 찾을 때 유용함
- 오디오, 시계열 및 신호 데이터를 분류하는 데도 매우 효과적임.

수십, 수백개의 계층을 가질 수 있음.
- 각 계층은 영상 및 데이터의 서로 다른 특징을 검출함.
- 각 훈련영성에 서로 다른 해상도의 필터가 적용되며, convolution된 각 영상은 다음 계층의 입력으로 사용됨.
  - 필터는 밝기, 경계와 같이 매우 간단한 특징으로 시작하여 객체를 고유하게 정의하는 특징으로 복잡도를 늘려나감.

CNN의 작동방식

입력계층(input layer), 은닉계층(hidden layer), 출력계층(output layer)으로 구분가능
- 이러한 계층은 해당 데이터의 고유한 특징을 학습한다는 의도로 데이터를 변경시키는 연산을 수행함.
  - 대표적인 3계층
    - convolution
      - 입력 영상의 일련의 convolution 필터에 통과시킴.
      - 각 필터는 영상에서 특정 특징을 활성화 함
    - ReLU
      - 음수값은 0에 매칭, 양수값은 그대로 둠
      - 더 빠르고 효과적이인 훈련이 이루어지도록 함
      - 이때 활성화된 특징만 다음계층으로 전달되므로 활성화(Actication)이라고도 함
    - pooling
      - 비선형 다운샘플링을 수행함.
      - 신경망이 학습해야 하는 파라미터 개수를 줄임으로써 출력을 단순화함.

가중치 및 편향

CNN에는 주어진 계층의 모든 은닉 뉴런에 대해 동일하게 공유된 가중치(weight)와 편향값(bias)이 있음
- 가중치 (Weight)
  - 가중치는 입력 데이터의 특성에 곱해져서 다음 레이어로 전달되는 값
  - 각각의 뉴런은 입력값에 대한 가중치와 활성화 함수의 출력을 곱한 값을 합산하여 처리
  - 가중치는 모델이 데이터의 패턴을 학습하고 표현하는 데 중요한 역할을
- 편향 (bias)
  - 각 뉴런의 출력에 더해지는 상수 값
  - 가중치와 함께 활성화 함수로 전달
  - 편향은 모델이 데이터를 올바르게 표현하고 예측하기 위해 데이터와 모델 사이의 차이를 조절하는 역할
  - 가중치가 데이터의 패턴을 조정하는 반면, 편향은 모델이 얼마나 잘 데이터를 표현하는지에 영향을 미침
- 가중치와 편향은 모델의 학습 과정에서 최적화되는 매개변수임
- 간단히 말해, 가중치는 입력 데이터의 각 특성에 대한 중요도를 조절하고, 편향은 모델의 전체적인 편향을 조절하는 역할

간단한 예제

mnist 손글씨 분류

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# 데이터 로드 및 전처리
(train_images, train_labels), (test_images, test_labels) = mnist.load_data()
train_images = train_images.reshape((60000, 28, 28, 1)).astype('float32') / 255
test_images = test_images.reshape((10000, 28, 28, 1)).astype('float32') / 255
train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

# CNN 모델 정의
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10, activation='softmax'))

# 모델 컴파일
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# 모델 학습
model.fit(train_images, train_labels, epochs=5, batch_size=64, validation_split=0.2)

# 모델 평가
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('Test accuracy:', test_acc)

참고자료

https://kr.mathworks.com/discovery/convolutional-neural-network-matlab.html

https://paperswithcode.com/method/convolution

https://paperswithcode.com/method/max-pooling

[ML] 단어 정리 (0)	2024.02.15
[DL] Gradient Vanishing / Exploding (1)	2024.02.14
시계열 데이터셋 저장소 정리 (0)	2024.02.09
[논문리서치] Accurate, Large Minibatch SGD:Training ImageNet in 1 Hour (2)	2024.02.05
[ML] DTW (Dynamic Time Warping) (0)	2024.02.03

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

EunGyeongKim

EunGyeongKim

[DL] CNN (Convolutional Neural Network) 본문

[DL] CNN (Convolutional Neural Network)

CNN의 작동방식

가중치 및 편향

간단한 예제

참고자료

'ML & DL' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역