728x90
반응형

Deep_Learning 75

I3D - Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

0. Introduction 최근 Video Classification을 공부하는 도중 Two Stream 방식의 대표적인 Model을 사용해 보고자 마음 먹게되었습니다. 이번에 Review해 볼 Paper는 I3D 방식(Inflated 3D)을 제시한 것을 알아보도록 하겠습니다. 제목은 'Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset'이며 Link에서 확인 가능합니다. 실제 구현은 https://github.com/deepmind/kinetics-i3d에서 구할 수 있습니다. 1. The old ones 먼저 I3D가 나오기 전에 사용하던 방식들에 대해서 알아보기로 하겠습니다. 1.1. The old 1 : ConvNet + L..

Deep_Learning 2023.09.24

A Comprehensive Study of Deep Video Action Recognition

1. Introduction video understanding에서 가장 중요한 작업 중 하나는 인간의 행동을 이해하는 것입니다. ( One of the most important tasks in video understanding is to understand human actions. ) 행동 분석, 비디오 검색, 인간-로봇 상호 작용, 게임 및 엔터테인먼트를 포함한 많은 실제 응용 프로그램이 있습니다. ( It has many real-world applications, including behavior analysis, video retrieval, human-robot interaction, gaming, and entertainment. ) 인간 행동 이해에는 인간 행동을 인식, 지역화 및 예..

Deep_Learning 2023.09.20

Deep Learning for 3D Point Clouds: A Survey

Regularly updated project page : https://github.com/The-Learning-And-Vision-Atelier-LAVA/SoTA-Point-Cloud 1. INTRODUCTION 2. BACKGROUND 2.1 Datasets 2.1.1 Dataset for 3D shape classification 3D Shape Classification Dataset에는 크게 2가지 Type이 있다. Synthetic datasets & Real-world datasets Synthetic dataset에 있는 Object는 겹침이나 배경같은 Data가 없이 깔끔하다 반면에, real-world dataset에 있는 Object들은 다른 층의 Object에 가려지고 일부 Ob..

Deep_Learning 2023.09.17

Kaggle - Paddy Disease Classification

https://www.kaggle.com/competitions/paddy-disease-classification/overview 쌀의 잎 모양을 보고 현재 질병을 있는 없는지, 질병이 있으면 어떤 질병인지 판단하는 Competition입니다. 기본적으로 Image Classification으로 진행해 보도록 하겠습니다. 0. Train import pandas as pd import os import numpy as np from sklearn.preprocessing import LabelEncoder from sklearn.model_selection import train_test_split import tensorflow as tf from tensorflow.keras.models impor..

Deep_Learning 2023.09.12

Age / Gender Detection Deep Learning Model

Repository for this project 0. Introduction 사람의 얼굴 Image로 성별 / 나이대를 판별하는 Model은 상점 등과 같은 고객의 통계 정보를 필요로 하는 곳에 유용하게 사용할 수 있을 것 같아서 이 Project를 진행하게 되었습니다. 0.1. Face Detector K-Face Dataset에서 사람 얼굴 부분만을 추출하기 위해서 Face Detector를 사용하여야 합니다. 여기서는 DNN Face Detector in OpenCV를 사용합니다. 참고 : https://pyimagesearch.com/2018/02/26/face-detection-with-opencv-and-deep-learning/ Face Detector는 Input으로 Image를 넣어주면..

Deep_Learning 2023.09.10

Mask Detection Deep Learning Model

이 Project의 Github Repository Link 0. Introduction 0.0. Motivation COVID-19 상황속에서 Deep Learning을 이용하여 RGB Cam.으로 실시간으로 Mask 착용 여부를 확인할 수 있는 Model을 만들어 보겠습니다. 0.1. Face Detector Dataset에서 사람 얼굴 부분만을 추출하기 위해서 Face Detector를 사용하여야 합니다. 우선 사람의 얼굴부분만을 빠르게 Detecting할 수 있는 Model을 찾아보았고, 최종적으로 Tensorflow와 호환이 잘되는 OpenCV DNN Face Detector를 사용하기로 했습니다. DNN Face Detector in OpenCV [https://learnopencv.com/f..

Deep_Learning 2023.09.09

The Strategy of Transfer Learning & Fine Tuning

0. Transfer Learning 다른 Dataset으로 이미 학습된(Pre-Trained) Model을 가져와서 내가 하고자 하는 작업에 적용하는 것을 말합니다. 1. Fine Tuning Pre-Trained Model은 다른 Dataset에서 학습된 Weight & Bias를 가지고 있기 때문에 새롭게 적용하려는 작업에 잘 맞지 않을 수가 있다. Pre-Trained Model을 새로운 작업에 맞게 Weight & Classifier를 새롭게 조정하는 작업을 Fine Tuning이라고 한다. Pre-Trained Model 전체를 다시 Tuning할 지 혹은 일부만 Tuning할 지는 여러가지 상황을 고려하여 선택한다. 3. Dataset의 특성과 양에 따른 Fine-Tuning 전략 3.1. ..

Deep_Learning 2023.09.02

Tensorflow Certificate

0. About Tensorflow Certificate Tensorflow Certiciate는 Google에서 운영하는 Tensorflow Developer 인증 시험입니다. 저는 Tensorflow를 주로 사용하고 있는데 이왕 사용하는 김에 자격증은 없나 찾아보다 알게되었고 이번에 취득하게 되었습니다. Tensorflow Certiciate는 AI Framework중의 하나인 Tensorflow를 활용하여 다양한 Model을 구축하는 능력을 확인하는 시험입니다. 간단하게 Tensorflow Certificate에 대해서 알아보면, 시험 주최는 Google이며 개인적으로 응시합니다. 시험은 Online환경에서 PyCharm의 Plug-In을 이용해서 치뤄집니다. ( VS Code는 안됩니다. Only..

Deep_Learning 2023.09.01

BERT Text Classification

이번 Post에서는 BERT Model을 이용하여, Text 분류 작업을 해보도록 하겠습니다. 영화 감상평이 긍정적인지 부정적인지 분류해 놓은 Data Set을 이용할 예정입니다. 실제로 사용할 Data Set은 Large Movie Review Dataset 입니다. 0. About BERT BERT 및 기타 Transformer Encoder Architecture는 Natural Language Process의 다양한 분야에서 좋은 성능을 보여주고 있습니다. BERT or Transformer Encoder는 Natural Language Process의 다양한 분야에 사용할 수 있는 Vector Space를 계산해 줍니다. BERT(Bidirectional Encoder Representation..

Deep_Learning 2023.08.29
728x90
반응형