[2026-03-03] [멀티모달] 텍스트만 파먹던 LLM은 잊어라, 근본부터 다시 짠 비전-언어 모델의 등장
Link: arXiv:2603.03276 Authors: Research Team Date: March 2026 솔직히 요즘 쏟아지는 VLM(비전-언어 모델)들 보면 좀 답답하지 않나요? LLaMA나 GPT 같은 텍스트 모델 기깔나게 깎아놓고, 그 위에 CLIP 같은 비전 인코더 하나 띡 붙여서 파인튜닝한 다음 “자, 이제 우리 모델도 눈이 생겼습니...
