728x90
반응형

Deep_Learning 64

Downstream in LLM

안녕하세요, MoonLight입니다.​LLM 분야에서 다운스트림(Downstream)은 사전 훈련된(pre-trained) LLM을 특정 목적이나 작업에 맞게 활용하거나 적용하는 모든 후속 단계를 의미합니다.​ 1. LLM의 개발 과정 LLM의 개발 과정을 크게 두 단계로 나누면 업스트림 (Upstream)과정과 다운스트림(Downstream) 과정으로 나눌 수 있습니다. 1.1. 업스트림 (Upstream)사전 훈련 (Pre-training)단계라고 말할 수 있으며, 이 단계에서는 인터넷과 같은 방대한 텍스트 데이터를 사용하여 LLM을 처음부터 학습시키는 단계입니다.​이 단계에서는 모델이 언어 자체의 패턴, 문법, 의미, 상식 등 광범위한 지식을 학습하게 되며, 당연하게도 매우 많은 계산 자원과 ..

Deep_Learning 2025.04.19

DeepSeek-VL : Towards Real-World Vision-Language Understanding

안녕하세요, MoonLight입니다.​DeepSeek의 다양한 Model들 중에, Multimodal Model인 DeepSeek-VL을 소개해 드리고, 간단한 사용법도 같이 알려드리고자 합니다.​ 1. DeepSeek-VL DeepSeek-VL은 Open Source Vision-Language 모델입니다. 입력으로 Image와 Text를 같이 받을 수 있는(Multimodal) Model입니다.​Logical Diagrams을 분석/작성하거나, Web Pages 작성, Formula 인식, 학술 논문 분석, 사진 분석/처리 등과 같은 Image에 대해서 다양한 작업을 할 수 있다는 의미입니다. 특징 Multimodal Input : Image와 Text를 동시에 입력받아 처리할 수 있습니다.D..

Deep_Learning 2025.04.19

마누스(Manus) AI Agent 사용기

안녕하세요, MoonLight입니다.​이번 Post에서는 지난달 공개된 'Manus(마누스)'라는 LLM AI Agent를 소개해 드리고자 합니다.​   1. Manus ? 지난 3월에 공개된 Manus는 지이차오(季逸超), 샤오홍(肖弘)이 설립한 Monica라는 중국 회사에서 개발한 LLM AI Agent이며, 3.5 Sonnet를 기반으로 다수의 툴을 적용하여 멀티 에이전트 협업 시스템을 구축하였습니다.​초대 코드가 있어야 사용할 수 있고, 초대 코드를 신청한다고 해서 모두 초대 코드를 받을 수 있는 것이 아니고, 심사(?)를 거쳐서 초대 코드를 배포한다고 하더군요.​​​간단하게 사용하려는 이유 등을 작성하여 보내면 몇일후에 심사를 거쳐 초대코드를 보내준다고 하던데, 저는 상당히 오래 걸렸습니다.​어..

Deep_Learning 2025.04.13

LoRA(Low-Rank Adaptation)

안녕하세요, MoonLight입니다.​LoRA(Low-Rank Adaptation)는 LLM을 효율적으로 Fine-Tuning하기 위한 방법 중 하나입니다.마이크로소프트 연구팀이 2021년에 발표한 논문 "LoRA: Low-Rank Adaptation of Large Language Models"에서 처음 소개되었습니다.이번 Post에서는 LoRA의 핵심 Idea와 동작 방식, 장점을 자세히 설명해 드리겠습니다.​   1. LoRA의 배경 OpenAI의 GPT, LLaMa 2, Claude 등과 같은 기반 Model 및 LLM은 텍스트 생성부터 언어 이해에 이르기까지 다양한 애플리케이션 분야에서 혁신적인 발전을 이루었습니다. ​이러한 Model들은 방대한 양의 Parameter를 활용하여 탁월한 성능을 ..

Deep_Learning 2025.04.12

Flash Attention : 더 빠르고 효율적인 Attention 메커니즘

안녕하세요, MoonLight입니다.​Flash Attention은 Stanford 연구진에 의해 제안되었으며, 기존 Transformer 모델의 핵심 구성 요소인 Attention 메커니즘을 개선한 기술입니다. Paperhttps://arxiv.org/pdf/2307.08691 FlashAttention GitHubhttps://github.com/Dao-AILab/flash-attention GitHub - Dao-AILab/flash-attention: Fast and memory-efficient exact attentionFast and memory-efficient exact attention. Contribute to Dao-AILab/flash-attention development by ..

Deep_Learning 2025.04.12

DLSS (Deep Learning Super Sampling)

안녕하세요, MoonLight입니다.​nVidia RTX 50 시리즈가 발표되었고, 성능과는 별개로 다양한 문제들로 인해서 시끌시끌합니다.​이 기회를 놓치지 않고 AMD가 9070으로 좋은 기회를 맞이하고 있습니다만, 이런 이야기말고 nVidia가 새롭게 발표한 DLSS 4.0에 대한 기술적 이야기와 AMD의 경재 기술인 FSR도 같이 이야기해 볼까 합니다.​​​  1. DLSS (Deep Learning Super Sampling) DLSS는 nVidia가 개발한 AI 기반 업스케일링 기술의 이름입니다. Deep Learning Super Sampling의 약자로, 낮은 해상도에서 렌더링된 게임 이미지를 AI를 활용해 고해상도 이미지로 업스케일링하여 화질 저하를 최소화하면서 프레임률을 향상시키는 기술을..

Deep_Learning 2025.03.22

Pandas Dataframe에 apply()에서도 진척도 확인하기

안녕하세요, MoonLight입니다.​저는 긴 작업을 수행하는 경우, 예를 들면 Model Train을 한다든지, Data 전체에 걸친 작업을 해야 하는데 금방 끝나지 않는 경우에 곡 tqdm을 사용해서 진척도를 확인하는 편입니다.​어느 정도 진행되고 있는지 혹시 뻗은 건 아닌지 확인해야 마음이 편해지기 때문입니다.​그런데, Pandas Dataframe에 apply()를 사용하는 경우에는 진척도를 볼 수가 없어서 답답한 경우가 있습니다.​이번 Post에서는 Pandas Dataframe에 apply()를 적용하는 경우에도 tqdm의 진척도 그래프를 볼 수 있는 방법을 알아보도록 하겠습니다.​​방법은 의외로 간단합니다. apply()대신 progress_apply()를 사용하면 됩니다.​생각보다 너무 쉬..

Deep_Learning 2025.03.03

Transfer Learning이란 무엇인가?

안녕하세요, MoonLight입니다.​이번 Post에서는 Deep Learning 분야에서 많이 사용되는 Transfer Learning에 대해서 알아보도록 하겠습니다.​​​ 1. Transfer Learning 개요 ​ 1.1. Transfer Learning이란 ?Deep Learning이 급속도로 발전하면서 Model의 성능이 비약적으로 향상되었지만, 여전히 Model을 처음부터 학습시키는 것은 매우 어려운 과제입니다.​우수한 성능을 갖춘 Deep Learning Model을 훈련하려면 대량의 데이터와 강력한 연산 자원이 필요하며, 적절한 학습이 이루어지기까지 오랜 시간이 소요됩니다.​또한, Model 학습이 한 번에 완벽하게 된다는 것은 현실에서는 있을 수 없는 일이며, 매우 많은 시행착오를 거치..

Deep_Learning 2025.02.20

PyTorch에서 .to(device)를 사용하는 이유

안녕하세요, MoonLight입니다.​PyTorch를 사용하다보면, Tensorflow에는 없는 '.to(device)'라는 문구를 보게 됩니다.​이번 Post에서는 이 명령어가 무엇이고 왜 필요한지에 대해서 알아보도록 하겠습니다.​​  1. 딥러닝 연산과 하드웨어 딥러닝 모델은 엄청난 부동소수점 연산을 행렬 연산(Matrix Computation)을 수행합니다.​이러한 연산은 CPU에서도 가능하지만, GPU(Graphics Processing Unit)를 활용하면 훨씬 빠르게 처리할 수 있습니다.​​CPU (중앙처리장치)GPU (그래픽처리장치)연산 방식직렬(Serial) 연산병렬(Parallel) 연산핵심 개수소수의 강력한 코어수천수만 개의 작은 코어연산 속도일반적인 연산에 적합대량의 연산을 빠르게 처..

Deep_Learning 2025.02.20

Anaconda PyTorch GPU 설치

안녕하세요, MoonLight입니다.​이번 Post에서는 PyTorch GPU Version을 설치해도록 하겠습니다.​Tensorflow보다 설치가 쉬울지 어떨지 한 번 해 보도록 하죠​우선, Anaconda를 이용해서 가상환경을 만들어서 설치할 예정이니, 이미 Anaconda가 설치되어 있다고 가정하겠습니다.​Anaconda는 아래 Link에서 받아서 설치하시면 됩니다. https://www.anaconda.com/download Download Anaconda Distribution | AnacondaDownload Anaconda's open-source Distribution today. Discover the easiest way to perform Python/R data science and..

Deep_Learning 2024.09.21
728x90
반응형