728x90
반응형

deepseek 5

주요 LLM Research #3

안녕하세요, MoonLight입니다.​RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.​전체 3개의 Post 중에 마지막이며, 나머지 Post는 아래 Link를 참고해 주시기 바랍니다. https://moonlight314.tistory.com/entry/%EC%A3%BC%EC%9A%94-LLM-Research-1 주요 LLM Research #1안녕하세요, MoonLight입니다.​RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만moonli..

Deep_Learning 2025.08.24

주요 LLM Research #2

안녕하세요, MoonLight입니다.​RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.​전체 3개의 Post 중에 2번째이며, 나머지 Post는 아래 Link를 참고해 주시기 바랍니다.​https://moonlight314.tistory.com/entry/%EC%A3%BC%EC%9A%94-LLM-Research-1 주요 LLM Research #1안녕하세요, MoonLight입니다.​RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만moonli..

Deep_Learning 2025.08.24

주요 LLM Research #1

안녕하세요, MoonLight입니다.​RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.​본 자료에는 다음과 같은 LLM들에 대한 자료가 포함되어 있습니다.​1. Mistral2. Qwen3. Llama4. Gemma5. Solar LLM6. DeepSeek7. Claude8. Command R+9. Phi-310. Xionic11. Falcon12. HyperCLOVA X​​각 LLM에 대해서 개발사 정보, Local 환경에서의 접근성(Model Download 가능 여부), API 접근 방식, Model의 종류(사용 목적별, Parameter 규모 등), 주요 특..

Deep_Learning 2025.08.24

Example of DPO(Direct Preference Optimization) Trainer in TRL

안녕하세요, MoonLight입니다.​지난 Post에서는 SFT(Supervised Fine-Tuning) Trainer를 사용하는 방법에 대한 내용을 다루었습니다.https://moonlight314.tistory.com/entry/Example-of-SFTSupervised-Fine-Tuning-Trainer-in-TRL Example of SFT(Supervised Fine-Tuning) Trainer in TRL안녕하세요, MoonLight입니다.​지난 번 Post에서 LLM을 Fine-tuning하고 Rreinforcement learning을 적용하는 데 사용되는 도구 모음인 TRL(Transformer Reinforcement Learning)에 대해서 알아보았습니다.https://moonl..

Deep_Learning 2025.08.12

DeepSeek-VL : Towards Real-World Vision-Language Understanding

안녕하세요, MoonLight입니다.​DeepSeek의 다양한 Model들 중에, Multimodal Model인 DeepSeek-VL을 소개해 드리고, 간단한 사용법도 같이 알려드리고자 합니다.​ 1. DeepSeek-VL DeepSeek-VL은 Open Source Vision-Language 모델입니다. 입력으로 Image와 Text를 같이 받을 수 있는(Multimodal) Model입니다.​Logical Diagrams을 분석/작성하거나, Web Pages 작성, Formula 인식, 학술 논문 분석, 사진 분석/처리 등과 같은 Image에 대해서 다양한 작업을 할 수 있다는 의미입니다. 특징 Multimodal Input : Image와 Text를 동시에 입력받아 처리할 수 있습니다.D..

Deep_Learning 2025.04.19
728x90
반응형