[2026-01-21] HERMES: KV 캐시를 계층적 메모리로 재설계한 실시간 스트리밍 비디오 이해의 새로운 지평
HERMES: KV 캐시를 계층적 메모리로 재설계한 실시간 스트리밍 비디오 이해의 새로운 지평 1. 핵심 요약 (Executive Summary) 최근 멀티모달 대규모 언어 모델(MLLM)은 오프라인 비디오 이해 분야에서 비약적인 발전을 이루었으나, 실시간 스트리밍 환경에서의 적용은 여전히 높은 장벽에 가로막혀 있습니다. 기존 방식은 지속적으로 유...
