Python/분류가 애매함

DeepLab v3+ 간단한 설명

공시탈출넘버원 2023. 9. 13. 16:17

DeepLab v3+ 자료들

논문: https://arxiv.org/abs/1802.02611

github 코드: https://github.com/rishizek/tensorflow-deeplab-v3-plus

과, 이를 한국어로 한번 분석한

https://kuklife.tistory.com/121

 

[Semantic Segmentation] DeepLab v3+ 원리

논문1. DeepLab V1 : https://arxiv.org/pdf/1412.7062.pdf 논문2. DeepLab V2 : https://arxiv.org/pdf/1606.00915.pdf 논문3. DeepLab V3 : https://arxiv.org/pdf/1706.05587.pdf 논문4. DeepLab V3+ : https:..

kuklife.tistory.com

글을 읽었다.

 

한번 해석한 것인데도 개념 잡기가 어려워서 내 방식대로 적으면서 한번 더 이해하였다.

여러분은 아래 그림을 보면서 감을 잡고, 다시 위에 티스토리 글이나 논문을 본다면 도움이 될 것이다. 그림 출처는 논문.

 

DeepLab v3+ 모델: encoder + decoder

 

실제 구조도 예제

  • encoder 부분의 가운데에 5가지 convolution 이 들어간다.
    거기서 맨 위, 맨 아래를 뺀 가운데 세 개가 각각 Atrous Convolution 이다.
  • Spatial Pyramid Pooling은 rate 다른걸 여러개 넣는 기술이다.
    예제에서는 rate 다른 것을 세 개(가운데 세 개) 넣었다.
  • Atrous Spatial Pyramid Pooling (ASPP) = Atrous Convolution + Spatial Pyramid Pooling
  • Atrous Separable Spatial Pyramid Pooling (ASSPP) = depthwise Separable convolution + ASPP

이들이 말하는 Xception model 은 extreme inception model 의 약자로서, 비슷한 이름의 전혀 다른 모델과 혼동하지 않도록 주의한다.

Decoder 는 잘 모르겠고, 핵심 기술이 아니어서 생략.