DeepLab v3+ 자료들
논문: https://arxiv.org/abs/1802.02611
github 코드: https://github.com/rishizek/tensorflow-deeplab-v3-plus
과, 이를 한국어로 한번 분석한
https://kuklife.tistory.com/121
글을 읽었다.
한번 해석한 것인데도 개념 잡기가 어려워서 내 방식대로 적으면서 한번 더 이해하였다.
여러분은 아래 그림을 보면서 감을 잡고, 다시 위에 티스토리 글이나 논문을 본다면 도움이 될 것이다. 그림 출처는 논문.
실제 구조도 예제
- encoder 부분의 가운데에 5가지 convolution 이 들어간다.
거기서 맨 위, 맨 아래를 뺀 가운데 세 개가 각각 Atrous Convolution 이다. - Spatial Pyramid Pooling은 rate 다른걸 여러개 넣는 기술이다.
예제에서는 rate 다른 것을 세 개(가운데 세 개) 넣었다. - Atrous Spatial Pyramid Pooling (ASPP) = Atrous Convolution + Spatial Pyramid Pooling
- Atrous Separable Spatial Pyramid Pooling (ASSPP) = depthwise Separable convolution + ASPP
이들이 말하는 Xception model 은 extreme inception model 의 약자로서, 비슷한 이름의 전혀 다른 모델과 혼동하지 않도록 주의한다.
Decoder 는 잘 모르겠고, 핵심 기술이 아니어서 생략.
'Python > 분류가 애매함' 카테고리의 다른 글
break, continue, pass 차이 알아보기 (chatGPT 활용) (0) | 2024.02.22 |
---|---|
파이썬 절대 주소값(absolute address) 받아오는 3가지 방법 (0) | 2023.09.15 |
CuDNN을 엔비디아 로그인 없이 다운 받는 꼼수 : The solution of, How to download CuDNN without login NVidia. (0) | 2023.09.13 |
Python에서 glob.glob() 쓸 때 디렉토리 주소 끝에를 /* 로 보정해주는 함수 (0) | 2023.09.13 |
코드 중간중간에 붙이는 주석 codetag(코드태그)의 목록 (0) | 2023.09.13 |