article detail
[AI픽] AI 기억 저장공간 20배 압축…디노티시아 연구논문 채택
2026. 7. 2. 오전 9:51
AI 요약
디노티시아는 KV캐시를 압축하는 기술 STAR-KV 논문과 소스코드를 공개했다고 2일 밝혔습니다. 논문 실험 결과 STAR-KV는 저랭크 압축만으로 KV캐시를 최대 75% 줄였고 혼합정밀도 양자화를 결합하면 전체 KV캐시를 최대 20배까지 압축했으며 어텐션 연산 속도는 최대 6.9배, 전체 생성 처리량은 최대 3.1배 향상됐고 기존 방식보다 정확도도 높았으며 UC샌디에이고 VVIP랩과의 공동연구로 ICML 2026 스포트라이트 논문으로 채택됐습니다