딥러닝(11) - VGGNet :: Solar the Nomadic Traveler

딥러닝(11) - VGGNet

딥러닝/CNN 2023. 3. 26. 01:07

👩‍💻 VGGNet

- 모든 합성곱 커널의 크기는 3×3, 최대 풀링 커널의 크기는 2×2이며, 스트라이드는 2이다.

- 특성 맵 : 64개, 224×224 크기 이므로 224×224×64로 표현된다.

- 마지막 16번째 계층을 제외하고는 모든 계층에 모두 ReLU 활성화 함수가 적용됨

✍ 라이브러리 불러오기

import copy
import numpy as np
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torch.utils.data as data
import torchvision
import torchvision.transforms as transforms
import torchvision.datasets as Datasets

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

🐍 import copy

- 객체 복사를 위해서 사용함

- 객체 복사 : 데이터 단위인 기존의 객체의 사본을 생성하는 것이다. 그 결과로 나오는 객체를 "객체 사본"(object copy)이라고 함

⭐ 단순한 객체 복사

original = [1, 2, 3] #original이라는 변수에 [1, 2, 3] 저장
copy_o = original #copy_o에 original 복사(shallow copy)
print(copy_o)
copy_o[2] = 10 #copy_o의 3을 10으로 값을 변경
print(copy_o)
print(original)

copy_o뿐만 아니라 원래 값인 original의 3도 10으로 바뀌게 됨

⭐ 얕은 복사 : 사본변수 = copy.copy(복사할 대상)

import copy

original = [[1, 2], 3]
copy_o = copy.copy(original) #original 값을 copy_o에 얕은 복사(copy.copy( )) 메서드를 사용하여 original 값을 copy_o에 복사함 
print(copy_o)
copy_o[0] = 100 #copy_o의 [1, 2] 값을 100으로 변경
print(copy_o)
print(original)

append = copy.copy(original)
append[0].append(4)#첫 번째 리스트([1, 2])에 4를 추가
print(append)
print(original)

append : 배열의 원소 추가 메서드이다.

-append[배열의 원소 인덱스].append(추가할 값)

- copy_o에서 [1, 2] 값을 100으로 변경했더니 copy_o만 바뀌게 됨

- [1, 2]에 4를 추가했더니 original과 copy_o 모두 반영됨

⭐ 깊은 복사 : 사본변수 = copy.deepcopy(복사할 대상)

import copy

original = [[1, 2], 3]
copy_o = copy.deepcopy(original) #original 값을 copy_o에 깊은 복사(copy.deepcopy())
print(copy_o)
copy_o[0] = 100 #copy_o의 [1, 2] 값을 100으로 변경
print(copy_o)
print(original)

append = copy.deepcopy(original)
append[0].append(4) #첫 번째 리스트([1, 2])에 4를 추가
print(append)
print(original)

- copy_o에서 [1, 2] 값을 100으로 변경했더니 copy_o만 바뀐 것은 동일함

- original은 그대로 보존됨

📚 이 부분은 VGG 모델을 직접 생성하는 것

✍ VGG 모델 정의하기

class VGG(nn.Module):
    def __init__(self, features, output_dim):
        super().__init__()
        self.features = features #VGG 모델에 대한 매개변수에서 받아 온 features 값을 self.features에 넣어 줍니다.
        self.avgpool = nn.AdaptiveAvgPool2d(7)
        self.classifier = nn.Sequential(
            nn.Linear(512*7*7, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(0.5),
            nn.Linear(4096, 4096),
            nn.ReLU(inplace=True),
            nn.Dropout(0.5),
            nn.Linear(4096, output_dim)
        ) #완전연결층과 출력층을 정의한다.

    def forward(self, x):
        x = self.features(x)
        x = self.avgpool(x)
        h = x.view(x.shape[0], -1)
        x = self.classifier(h)
        return x, h

✍ VGG 모델 유형 정의하기

vgg11_config = [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'] 
# 8(합성곱층 - 정의된 숫자 개수) + 3(풀링층 - (M개수 -2)) = 11(전체 계층) = VGG11

vgg13_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512,  'M'] 
# 10(합성곱층 - 정의된 숫자 개수) + 3(풀링층 - (M개수 -2)) = 13(전체 계층) = VGG13

vgg16_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'] 
# 13(합성곱층- 정의된 숫자 개수) + 3(풀링층 - (M개수 -2)) = 16(전체 계층) = VGG16

vgg19_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 256, 'M', 512, 512, 512, 512, 'M', 512, 512, 512, 512, 'M'] 
# 16(합성곱층 - 정의된 숫자 개수) + 3(풀링층 - (M개수 -2)) = 19(전체 계층) = VGG19

✍ VGG 계층 정의

def get_vgg_layers(config, batch_norm):
    layers = []
    in_channels = 3

    for c in config: #vgg11_config 값들을 가져온다. (for c in config를 하면 가져오는 것)
        assert c == 'M' or isinstance(c, int) 
        if c == 'M': #불러온 값이 ‘M’이면 최대 풀링(MaxPool2d)을 적용
            layers += [nn.MaxPool2d(kernel_size = 2)]
        else: #불러온 값이 숫자이면 합성곱(Conv2d) 적용
            conv2d = nn.Conv2d(in_channels, c, kernel_size=3, padding=1)
            if batch_norm: #배치 정규화(batch normalization)를 적용할지에 대한 코드
                layers += [conv2d, nn.BatchNorm2d(c), nn.ReLU(inplace=True)] #배치 정규화가 적용될 경우 배치 정규화+ReLU 적용       
            else:
                layers += [conv2d, nn.ReLU(inplace=True)] #배치 정규화가 적용되지 않을 경우 ReLU만 적용
            in_channels = c

    return nn.Sequential(*layers) #네트워크의 모든 계층을 반환

🐍 for c in config:
assert c == 'M' or isinstance(c, int) :조건문 - 가정 설정문

⭐ for c in config :

- 위에서 정의한 config(모델을 배열로 정의한 것)에서 원소를 가져옴

⭐ assert c == 'M' or isinstance(c, int)

📌 assert

- 가정 설정문

- 뒤의 조건이 True가 아니면 에러를 발생시킨다.

- c == 'M'이 아니면 오류가 발생한다.

📌 isinstance(c, int)

- 주어진 조건이 True인지 판단함(검증)

print(isinstance(1, int)) #1이 integer인지 판단
print(isinstance(1.2, int)) # 1.2가 integer인지 판단
print(isinstance('deep learning', str)) #deep learning이 string인지 판단

- assert c == 'M' or isinstance(c, int) 의미는 c가 'M'이 아니거나 int가 아니라면 오류가 발생하도록 함

✍ 모델 계층 생성

- get_vgg_layers() 함수 : VGG 모델의 계층을 생성

- 배치 정규화(batch normalization)에 대한 계층도 추가해주기(get_vgg_layers 옵션에 추가)

vgg11_layers = get_vgg_layers(vgg11_config, batch_norm=True)
print(vgg11_layers)

🐍 batch_norm = True(배치 정규화)

- 데이터의 평균을 0으로, 표준편차를 1로 분포시키는 것

- 각 계층의 입력에 대한 분산을 평균 0, 표준편차 1로 분포시키는 것

👋 VGG 계층 출력

✍ VGG 전체에 대한 네트워크(vgg11_layers()와 VGG에서 정의한 완전연결층과 출력층 포함)

OUTPUT_DIM = 2 #개와 고양이 두 개를 클래스 사용 출력층은 2개이다. 
model = VGG(vgg11_layers, OUTPUT_DIM)
print(model)

- vgg11_layers, 완전연결층과 출력층((classifier): Sequential()) 부분이 합쳐져서 출력됨

- 위에 것까지는 VGG 모델을 직접 만들어서 전체 네트워크를 직접 설계하는 것이다. VGG 모델은 이미 누군가가 대용량의 이미지 데이터로 학습을 시켰으며, 최상의 상태로 튜닝을 거쳐 모든 사람이 사용할 수 있도록 공유한 사전 훈련된 모델이므로

📚 VGG 사전 훈련된 모델 사용

✍ VGG 사전 훈련 모델 가져오기

import torchvision.models as models
pretrained_model = models.vgg11_bn(pretrained=True) 
print(pretrained_model)

🐍 pretrained_model = models.vgg11_bn(pretrained=True)

⭐ vgg11_bn

- VGG11 기본 모델에 배치 정규화(bn)가 적용된 모델을 사용함

⭐ pretrained = True

- 사전 훈련된 모델을 사용(미리 학습된 파라미터 값들을 사용)

✍ VGG 모델 유형 정의하기

vgg11_config = [64, 'M', 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'] 
vgg13_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 'M', 512, 512, 'M', 512, 512, 'M'] 
vgg16_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 'M', 512, 512, 512, 'M', 512, 512, 512, 'M'] 
vgg19_config = [64, 64, 'M', 128, 128, 'M', 256, 256, 256, 256, 'M', 512, 512, 512, 512, 'M', 512, 512, 512, 512, 'M'] 
My_Vgg = [64, 64, 64, 'M', 128, 128, 128, 'M', 256, 256, 256, 'M']

✍ 이미지 데이터 전처리 정의하기

'딥러닝 > CNN' 카테고리의 다른 글

Image Segmentation(1) (0)	2023.03.31
딥러닝(12) - GoogLeNet (0)	2023.03.26
딥러닝(10) - AlexNet (0)	2023.03.24
딥러닝(9) - 합성곱신경망(2) : LeNet-5 (0)	2023.03.23
딥러닝(8) - 그래프합성곱 (0)	2023.03.23

ABOUT ME

Solar the Nomadic Traveler Solar the Nomadic Traveler

👩‍💻 VGGNet

📚 이 부분은 VGG 모델을 직접 생성하는 것

📚 VGG 사전 훈련된 모델 사용

'딥러닝 > CNN' 카테고리의 다른 글

티스토리툴바

ABOUT ME

👩‍💻 VGGNet

📚 이 부분은 VGG 모델을 직접 생성하는 것

📚 VGG 사전 훈련된 모델 사용

'딥러닝 > CNN' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바