- object detection
- Convolution 종류
- Optimizer
- 딥러닝
- deep learning
- image classification
- LeNet 구현
- SPP-Net
- overfeat
- Weight initialization
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Today
- Total
목록image classification (22)
I'm Lim
Paper Howard, Andrew, et al. "Searching for mobilenetv3." Proceedings of the IEEE/CVF international conference on computer vision. 2019. Introduction 본 논문의 목적은 모바일 환경에서 정확도와 레이턴스간의 trade-off를 최적화시키는 것이다. 이를 위해, MobileNet v3는 NASNet과 같이 Neural Architecture Search 알고리즘을 사용하였다고 한다. Efficient Mobile Building Blocks MobileNet v3의 특징은 아래와 같다. 1 ) SENet에서 사용하던 Squeeze operation과 Excitation operation을 적..
Paper He, Tong, et al. "Bag of tricks for image classification with convolutional neural networks." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2019. Abstract 본 논문은 ResNet 모델의 Ablation study로써, ResNet-50의 top-1 accuracy를 75.3%에서 79.29%까지 개선시켰다고 한다. 또한, Image Classification 모델의 성능개선이 object detection이나 semantic segmentation과 같은 응용분야의 성능을 개선시킨다고 한다. Introduct..
Paper Sandler, Mark, et al. "Mobilenetv2: Inverted residuals and linear bottlenecks." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Introduction 논문 발표 당시, Image Classification 모델들은 성능을 올리기 위해 파라미터의 수를 키웠고, 이는 모바일 기기나 임베디드 시스템에 탑재할 수 있는 범위를 넘어섰다. 본 논문의 모델인 MobileNet v2는 성능을 유지하면서, 요구 메모리와 연산의 수를 크게 줄였다고 한다. 이를 위해 Inverted residual structure를 제안하였는데, inverted..
Paper Ma, Ningning, et al. "Shufflenet v2: Practical guidelines for efficient cnn architecture design." Proceedings of the European conference on computer vision (ECCV). 2018. Abstract Image Classification 모델들의 계산 복잡도의 평가지표로 FLOPs를 주로 사용하는데 이는 간접적인 평가지표이고, 직접적인 평가지표인 Speed는 메모리 접근 시간이나 플랫폼의 특성에 의존한다. 따라서, 이 논문에서는 특정 플랫폼에서 직접적인 평가지표를 이용하여 평가하는 것을 목표로 하였다. Introduction Image Classification 모델의 또 다..
Paper Howard, Andrew G., et al. "Mobilenets: Efficient convolutional neural networks for mobile vision applications." arXiv preprint arXiv:1704.04861 (2017). Abstract MobileNet은 depthwise seperable convolution을 이용하여 모델을 가볍게 만들었다. MobileNet Architecture 1. Depthwise Separable Convolution 1 ) 기존의 CNN 연산의 컴퓨터 계산량은 다음과 같다. 여기서 $D_k$는 커널의 크기이고, $N$은 출력 채널의 개수이며, $M$은 입력 채널의 개수, $D_F$는 feature map의 크기..
Paper Zoph, Barret, et al. "Learning transferable architectures for scalable image recognition." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Abstract Image Classification 모델을 개발하는 것은 상당한 노력이 필요하다. 이 논문에서는 데이터 셋에 맞게 알아서 모델 구조를 학습하는 방법을 연구한다. 이러한 방식은 데이터 셋이 크다면 굉장히 오래걸리기 때문에 작은 데이터 셋에서 그 구조를 만들고, 큰 데이터 셋으로 확장한다고 한다. 작은 데이터 셋으로 CIFAR-10을 이용하였고, 이를 통해 찾은 모델 구..
Paper Huang, Gao, et al. "Condensenet: An efficient densenet using learned group convolutions." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Abstract CondenseNet은 learned group convolution이라 불리는 새로운 모듈의 dense connectivity로 이루어진다. dense connectivity는 네트워크의 feature를 재사용하는데 유용한 반면, learned group convolution은 레이어간 불필요한 learning group convolution을 제거한다. Introdu..
Paper Hu, Jie, Li Shen, and Gang Sun. "Squeeze-and-excitation networks." Proceedings of the IEEE conference on computer vision and pattern recognition. 2018. Abstract Xception이나 ResNext 등의 논문에서 제시한대로 이미지를 cross-channel correlation과 spatial correlation으로 나눠볼 수 있다면, 지금까지의 Image Classification 모델들은 Spatial correltation을 잘 처리하여 표현력을 증가시키는 방법을 연구해왔다고 볼 수 있다. SENet은 channel 방향의 channel correlation에 집중..