'deepseek' 태그의 글 목록

728x90

deepseek 5

안녕하세요, MoonLight입니다.RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.전체 3개의 Post 중에 마지막이며, 나머지 Post는 아래 Link를 참고해 주시기 바랍니다. https://moonlight314.tistory.com/entry/%EC%A3%BC%EC%9A%94-LLM-Research-1 주요 LLM Research #1안녕하세요, MoonLight입니다.RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만moonli..

Deep_Learning 2025.08.24

주요 LLM Research #2

안녕하세요, MoonLight입니다.RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.전체 3개의 Post 중에 2번째이며, 나머지 Post는 아래 Link를 참고해 주시기 바랍니다.https://moonlight314.tistory.com/entry/%EC%A3%BC%EC%9A%94-LLM-Research-1 주요 LLM Research #1안녕하세요, MoonLight입니다.RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만moonli..

Deep_Learning 2025.08.24

주요 LLM Research #1

안녕하세요, MoonLight입니다.RAG System 구축을 진행중에 어떤 LLM을 사용해야 할 지를 고민하다가 현재 시장에 출시된 접근 가능한 LLM들의 특징을 전체적으로 조사할 필요를 느껴서 본 자료를 만들게 되었습니다.본 자료에는 다음과 같은 LLM들에 대한 자료가 포함되어 있습니다.1. Mistral2. Qwen3. Llama4. Gemma5. Solar LLM6. DeepSeek7. Claude8. Command R+9. Phi-310. Xionic11. Falcon12. HyperCLOVA X각 LLM에 대해서 개발사 정보, Local 환경에서의 접근성(Model Download 가능 여부), API 접근 방식, Model의 종류(사용 목적별, Parameter 규모 등), 주요 특..

Deep_Learning 2025.08.24

Example of DPO(Direct Preference Optimization) Trainer in TRL

안녕하세요, MoonLight입니다.지난 Post에서는 SFT(Supervised Fine-Tuning) Trainer를 사용하는 방법에 대한 내용을 다루었습니다.https://moonlight314.tistory.com/entry/Example-of-SFTSupervised-Fine-Tuning-Trainer-in-TRL Example of SFT(Supervised Fine-Tuning) Trainer in TRL안녕하세요, MoonLight입니다.지난 번 Post에서 LLM을 Fine-tuning하고 Rreinforcement learning을 적용하는 데 사용되는 도구 모음인 TRL(Transformer Reinforcement Learning)에 대해서 알아보았습니다.https://moonl..

Deep_Learning 2025.08.12

DeepSeek-VL : Towards Real-World Vision-Language Understanding

안녕하세요, MoonLight입니다.DeepSeek의 다양한 Model들 중에, Multimodal Model인 DeepSeek-VL을 소개해 드리고, 간단한 사용법도 같이 알려드리고자 합니다. 1. DeepSeek-VL DeepSeek-VL은 Open Source Vision-Language 모델입니다. 입력으로 Image와 Text를 같이 받을 수 있는(Multimodal) Model입니다.Logical Diagrams을 분석/작성하거나, Web Pages 작성, Formula 인식, 학술 논문 분석, 사진 분석/처리 등과 같은 Image에 대해서 다양한 작업을 할 수 있다는 의미입니다. 특징 Multimodal Input : Image와 Text를 동시에 입력받아 처리할 수 있습니다.D..

Deep_Learning 2025.04.19

Today :
Yesterday :

맛집, 건담, 리뷰, 유니콘, 가볼만한곳, 결말, 사자비, 버카, 코엑스, 건프라, 도색, 프리덤, 커스텀, 아이들, 파이썬, 뉴건담, 취미, 시드, TensorFlow, 조립,

728x90

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

deepseek 5

티스토리툴바