728x90
반응형

prompt 2

한 권으로 끝내는 이미지 생성 AI with 미드저니

한빛미디어 '나는 리뷰어다' 활동을 위해서 책을 제공받아 작성된 서평입니다. ​ ​ ​ ​ ChatGPT가 발표된 이후로 최근 몇 년간은 생성형 AI Model이 급속도로 발전하는 기간이었습니다. 처음에는 텍스트만 생성하다가 최근 Sora가 보여주듯이 이제는 멋진 영상을 만들어내는 경지에까지 왔습니다. ​ 이 책은 최근 몇 년간 급속도로 발전한 이미지 생성 AI 기술의 여정을 탐구하고 있습니다. GAN으로 시작되는 이미지 생성 AI의 역사에서부터 최근의 혁신인 Dall-E, 미드저니, 그리고 오픈 소스 프로젝트인 Stable Diffusion까지 각 Model의 특징을 자세히 비교하고 있습니다. 기술적 복잡성을 걷어내고, AI가 어떻게 우리의 창의력을 확장하고 다양한 분야에서 활용될 수 있는지에 초점을 ..

Book Review 2024.03.14

Honeybee - 카카오브레인의 Multimodal LLM

안녕하세요, MoonLight입니다. ​ 이번 Post에서는 지난 달 카카오브레인에서 발표한 Multimodal LLM Honeybee에 대해서 알아보도록 하겠습니다. ​ Multimodal Model이란 다양한 입력의 형태를 받아들여서 결과를 내는 Model을 뜻합니다. ​ 예를 들어, 이미지, 텍스트, 소리 등의 입력을 받아서 학습한 Model을 뜻합니다. ​ Honeybee의 경우에는 이미지와 텍스트를 입력으로 받아서 텍스트를 출력하는 LLM입니다. ​ 카카오브레인에서 Honeybee를 Open Source로 공개하였고, 실제로 어느 정도 성능인지 제가 한 번 Test해 보도록 하겠습니다. ​ ​ 카카오브레인 Blog https://blog.kakaobrain.com/news/1391​ 멀티모달 언..

Deep_Learning 2024.02.21
728x90
반응형