article detail
리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화
2026. 5. 30. 오후 12:55

AI 요약
리퀴드 AI는 28일(현지시간) 소비자용 하드웨어에서 실행할 수 있는 도구 호출과 에이전트 작업에 최적화된 전문가 혼합(MoE) 모델 'LFM2.5-8B-A1B'를 공개했으며, 총 83억개(8.3B) 매개변수 중 실제 추론에서는 15억개(1.5B)만 활성화되는 희소 구조로 노트북과 스마트폰에서도 실행 가능한 연산 효율을 확보했다고 설명했습니다. 새 모델은 최대 12만8000토큰의 장문 컨텍스트와 38조 토큰의 사전학습 데이터를 지원하고 어휘 사전 규모를 12만8000개로 확대했으며, 추론 전용 설계와 강화학습 기반 환각 억제 기법을 적용해 아티피셜 애널리시스 비환각률이 7.46에서 63.47로 개선되는 등 성능 향상을 보였습니다. 실행 성능은 애플 M5 맥스에서 초당 253토큰, AMD 라이젠 AI 맥스+ 395에서는 초당 146토큰, 스마트폰에서는 초당 약 30토큰, 단일 엔비디아 H100에서는 초당 1만8500토큰을 기록했고 모델 가중치는 허깅페이스에서 공개되며 연간 매출 1000만달러 미만의 기업·개인은 상업적으로 무료로 이용할 수 있습니다.







