| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 |
- Vision Transformer
- C++
- convolution
- 모수 추정 방법
- 최대 사후 확률
- 오블완
- computer graphics
- Focal loss
- mobilenet
- posec3d
- Image denoising
- Deep Learning
- depthwise convolution
- CNN
- DDPM
- 최대 가능도 추정
- 티스토리챌린지
- 딥러닝
- Action Recognition
- OpenGL
- Unreal Engine
- Diffusion
- 포인터
- deformable covolution
- Swin Transformer
- covolution
- Today
- Total
목록Deep Learning (3)
심드렁하게 저장
Dilated Convolution Dilated Convolution은 커널의 필터 사이를 띄워서 적용하는 연산이다. 즉, 샘플 간 간격(dilation rate) 을 넓게 벌려서 더 넓은 receptive field(CNN에서 출력 레이어의 뉴런 하나에 영향을 미치는 입력 뉴런들의 공간 크기)를 확보 할 수 있다. 기존 Convolution은 인접한 픽셀에만 반응하지만 Dilated Conv는 픽셀 사이를 건너뛰며 계산하므로 멀리 떨어진 정보까지 한번에 수용 가능하다. 또한 해상도 손실 없이 더 넓은 문맥을 담을 수 있다. Dilated Conv의 활용사례는 다음과같다.DeepLab v3+여러 dilation rate로 multi-scale context 학습WaveNet오디오 생성 시, 시계열에서 ..
개요PoseC3D는 2021년 CVPR Workshop에서 발표된 논문에서 제안된 모델로 논문의 풀 네임은 "Revisiting Skeleton-based Action Recognition"이다. Skeleton Based Action Recognition 모델로서 2D Keypoint를 입력으로 받아 사람의 행동을 인식한다. 해당모델은 꽤 오래전 논문이지만 아직까지도 Papers with code 기준 상위권에 위치하고 있다. 또한 훈련 dataset을 구성할때 2D Keypoint를 사용한다는 점에서 활용 난이도도 높지 않을것으로 예상되어 행동 인식 프로젝트의 메인 모델로 채택하게 되었다. 1. GOAL - 본 논문의 목적 본 논문 이전 기존 Skeleton-based Action Recogniti..
FocalLoss 개요Focal Loss는 불균형한 클래스 분포 (Class imbalance) 문제를 해결하기 위해 고안된 손실 함수로, 특히 객체 탐지 문제에서 널리 사용된다. 이 Loss는 Rare 클래스에 집중하도록 손실을 조정하는 것이 핵심이다.FocalLoss의 특징일반적인 분류 문제에서 사용하는 Cross Entropy Loss는 다음과 같다. 여기서 $y\in{0,1}$은 정답 Label, $p\in{0,1}$은 모델이 예측한 확률이다.Cross Entropy loss의 문제점은 대부분의 경우 쉬운예제(이미 잘 맞추는 예제)에도 동일하게 손실을 계산한다. 이로인해 어려운예제(드물고 잘 분류되지 않는 클래스)에 집중하지 못한다. Focal Loss는 쉬운 예제의 손실을 감소시켜 무시하고 어려..