λ”₯λŸ¬λ‹/RNN

R-CNNκ³Ό 풀링

SolartheNomad 2023. 3. 26. 19:25

πŸ“Œ μŠ¬λΌμ΄λ”© μœˆλ„μš°(sliding window) λ°©μ‹

 

- 객체 인식 μ•Œκ³ λ¦¬μ¦˜μ˜ ν•œ μ’…λ₯˜

- μ΄λ―Έμ§€μ˜ λͺ¨λ“  μ˜μ—­μ„ νƒμƒ‰ν•˜λ©΄μ„œ 객체λ₯Ό κ²€μΆœν•΄ λ‚΄λŠ” 방식

- μš”μ¦˜ 거의 μ‚¬μš©λ˜μ§€ μ•ŠμŒ

 

πŸ“Œ 후보 μ˜μ—­(region proposal)

 

-  μ„ νƒμ  탐색(selective search) μ•Œκ³ λ¦¬μ¦˜μ„ 적용

- 이미지 λΆ„λ₯˜λ₯Ό μˆ˜ν–‰ν•˜λŠ” CNN + μ΄λ―Έμ§€μ—μ„œ 객체가 μžˆμ„ λ§Œν•œ μ˜μ—­μ„ μ œμ•ˆν•΄ μ£ΌλŠ” 후보 μ˜μ—­ μ•Œκ³ λ¦¬μ¦˜μ„ κ²°ν•©ν•œ μ•Œκ³ λ¦¬μ¦˜

 

πŸ“Œ λΆ„ν• (segmentation)

- μ˜μƒ λ°μ΄ν„°μ˜ νŠΉμ„±(색상, λͺ¨μ–‘, 무늬 λ“±)에 따라 λΆ„ν• ν•˜μ—¬ 후보 μ˜μ—­μ„ μ„ μ •

 

πŸ“Œ 후보 μ˜μ—­(λ°”μš΄λ”© λ°•μŠ€)

- 3D 객체의 ν˜•νƒœλ₯Ό λͺ¨λ‘ 포함할 수 μžˆλŠ” μ΅œμ†Œ 크기의 λ°•μŠ€

 

 

 

πŸ“Œ 선택적 탐색(selective search) μ•Œκ³ λ¦¬μ¦˜

 

1. 초기 μ˜μ—­ 생성

- μž…λ ₯된 이미지λ₯Ό μ˜μ—­ λ‹€μˆ˜λ‘œ λΆ„ν• ν•˜λŠ” κ³Όμ •

2. μž‘μ€ μ˜μ—­μ˜ 톡합

- 1λ‹¨κ³„μ—μ„œ μ˜μ—­ μ—¬λŸ¬ 개둜 λ‚˜λˆˆ 것듀을 λΉ„μŠ·ν•œ μ˜μ—­μœΌλ‘œ 톡합

-  그리디 μ•Œκ³ λ¦¬μ¦˜μ„ ν†΅ν•˜μ—¬ λΉ„μŠ·ν•œ μ˜μ—­μ΄ ν•˜λ‚˜λ‘œ 톡합될 λ•ŒκΉŒμ§€ λ°˜λ³΅ν•œλ‹€. 

 

3. 후보 μ˜μ—­(λ°”μš΄λ”©λ°•μŠ€) 생성

 

 

🐍 R- CNN ν•™μŠ΅ 절차

 

1. μ΄λ―Έμ§€λ₯Ό μž…λ ₯으둜 λ°›κΈ°

⬇

2. 2000개의 λ°”μš΄λ”© λ°•μŠ€(bounding box)λ₯Ό 선택적 탐색 μ•Œκ³ λ¦¬μ¦˜μœΌλ‘œ μΆ”μΆœν•œ ν›„ 잘라 λ‚΄κ³ (cropping), CNN λͺ¨λΈμ— λ„£κΈ° μœ„ν•΄ 같은 크기(227×227 ν”½μ…€)둜 ν†΅μΌν•œλ‹€.(warping)

⬇

3. ν¬κΈ°κ°€ λ™μΌν•œ 이미지 2000κ°œμ— 각각 CNN λͺ¨λΈμ„ μ μš©ν•œλ‹€.

⬇

4. κ°κ° λΆ„λ₯˜λ₯Ό μ§„ν–‰ν•˜μ—¬ κ²°κ³Όλ₯Ό λ„μΆœν•œλ‹€.(λΆ„λ₯˜λͺ¨λΈ μ‚¬μš©)

 

곡간 ν”ΌλΌλ―Έλ“œ 풀링

- κΈ°μ‘΄ CNN κ΅¬μ‘°λŠ”  μ™„μ „ 연결측을 μœ„ν•΄ μž…λ ₯ 이미지λ₯Ό κ³ μ •ν•˜κΈ° λ•Œλ¬Έμ— 신경망을 ν†΅κ³Όμ‹œν‚€λ €λ©΄ κ°•μ œλ‘œ 고차원 -> μ €μ°¨μ›μœΌλ‘œ κ°μΆœμ‹œν‚€κ±°λ‚˜ 쑰정을 ν•΄μ•Όν•˜κΈ° λ•Œλ¬Έμ— 물체의 일뢀뢄이 μž˜λ¦¬κ±°λ‚˜ 본래의 

 

- μž…λ ₯ μ΄λ―Έμ§€μ˜ 크기에 관계없이 합성곱측을 ν†΅κ³Όμ‹œν‚€κ³ , 완전연결측에 μ „λ‹¬λ˜κΈ° 전에 νŠΉμ„± 맡듀을 λ™μΌν•œ 크기둜 μ‘°μ ˆν•΄ μ£ΌλŠ” 풀링측을 μ μš©ν•˜λŠ” 기법이닀. 

- μž…λ ₯ μ΄λ―Έμ§€μ˜ 크기λ₯Ό μ‘°μ ˆν•˜μ§€ μ•Šκ³  합성곱측을 ν†΅κ³Όμ‹œν‚€κΈ° λ•Œλ¬Έμ— 원본 μ΄λ―Έμ§€μ˜ νŠΉμ§•μ΄ ν›Όμ†λ˜μ§€ μ•ŠλŠ” νŠΉμ„± 맡을 얻을 수 있음

 

Rol 풀링

- 크기가 λ‹€λ₯Έ νŠΉμ„± 맡의 μ˜μ—­λ§ˆλ‹€ μŠ€νŠΈλΌμ΄λ“œλ₯Ό λ‹€λ₯΄κ²Œ μ΅œλŒ€ 풀링을 μ μš©ν•˜μ—¬ 결괏값 크기λ₯Ό λ™μΌν•˜κ²Œ λ§žμΆ”λŠ” 방법

 

 

- μ—¬κΈ°μ„œ λ°•μŠ€ ν•˜λ‚˜ν•˜λ‚˜λŠ” ν•˜λ‚˜μ˜ νŠΉμ„± λ§΅(ν•©μ„±κ³±κ³„μΈ΅μ˜ μž…μΆœλ ₯ 데이터 ν•˜λ‚˜ν•˜λ‚˜)을 μ˜λ―Έν•¨ 

-  1번 8*8 λ§΅μ—μ„œ μ„ νƒμ μœΌλ‘œ 후보 맡인 7*5 ν›„λ³΄μ˜μ—­μ„ 뽑아내면,

 

Fast R-CNN

 

-  Fast R-CNN(Fast Region-based CNN)은 R-CNN의 속도 문제λ₯Ό κ°œμ„ ν•˜κΈ° μœ„ν•˜μ—¬ RoI 풀링을 λ„μž…ν•œ λͺ¨λΈ 

- 선택적 νƒμƒ‰μ—μ„œ 찾은 λ°”μš΄λ”© λ°•μŠ€ 정보가 CNN을 ν†΅κ³Όν•˜λ©΄μ„œ μœ μ§€λ˜λ„λ‘ ν•˜κ³  μ΅œμ’… CNN νŠΉμ„± 맡은 풀링을 μ μš©ν•˜μ—¬ 완전연결측을 ν†΅κ³Όν•˜λ„λ‘ 크기λ₯Ό μ‘°μž‘ν•˜μ—¬ μ‹œκ°„μ„ 단좕함

-  Fast R-CNN에 후보 μ˜μ—­ μΆ”μΆœ λ„€νŠΈμ›Œν¬(Region Proposal Network, RPN)λ₯Ό μΆ”κ°€ν•œ 것

 

 

 

 

 

 

 

 

 

후보 μ˜μ—­ μΆ”μΆœ λ„€νŠΈμ›Œν¬