IT뉴스모아news terminal

article detail

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

AI타임스MoE경량모델도구호출에이전트오픈소스온디바이스AI추론최적화환각억제
2026. 5. 30. 오후 12:55
리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

AI 요약

리퀴드 AI는 28일(현지시간) 소비자용 하드웨어에서 실행할 수 있는 도구 호출과 에이전트 작업에 최적화된 전문가 혼합(MoE) 모델 'LFM2.5-8B-A1B'를 공개했으며, 총 83억개(8.3B) 매개변수 중 실제 추론에서는 15억개(1.5B)만 활성화되는 희소 구조로 노트북과 스마트폰에서도 실행 가능한 연산 효율을 확보했다고 설명했습니다. 새 모델은 최대 12만8000토큰의 장문 컨텍스트와 38조 토큰의 사전학습 데이터를 지원하고 어휘 사전 규모를 12만8000개로 확대했으며, 추론 전용 설계와 강화학습 기반 환각 억제 기법을 적용해 아티피셜 애널리시스 비환각률이 7.46에서 63.47로 개선되는 등 성능 향상을 보였습니다. 실행 성능은 애플 M5 맥스에서 초당 253토큰, AMD 라이젠 AI 맥스+ 395에서는 초당 146토큰, 스마트폰에서는 초당 약 30토큰, 단일 엔비디아 H100에서는 초당 1만8500토큰을 기록했고 모델 가중치는 허깅페이스에서 공개되며 연간 매출 1000만달러 미만의 기업·개인은 상업적으로 무료로 이용할 수 있습니다.

원문보기
feed://articles/related관련 기사
3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]IT조선
2026. 4. 24. 오전 8:00

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

경량모델MoE구조에이전트컨텍스트오픈소스멀티모달코딩능력추론최적화
페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개로봇신문
2026. 4. 22. 오후 3:30

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

휴머노이드로봇로봇OS온디바이스AI음성인식에이전트물리AI경량모델멀티모달
문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"네이트
2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘
클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]IT조선
2026. 4. 17. 오전 6:00

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

경량모델MoE구조코딩성능API가격로봇비전에이전트추론최적화멀티모달
구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.Vietnam.vn
2026. 4. 8. 오후 7:07

구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.

온디바이스AI경량모델오픈소스개인정보보호오프라인실행엣지컴퓨팅생성AI모바일AI
개방·경량 AI 경쟁 본격화…구글 젬마4 확산매일경제 마켓
2026. 4. 7. 오전 6:13

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스라이선스온디바이스추론에이전트
개방·경량 AI 경쟁 본격화…구글 젬마4 확산v.daum.net
2026. 4. 7. 오전 6:15

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스생태계에이전트온디바이스LLM
‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다헬로티
2026. 5. 29. 오후 1:03

‘피지컬 AI 시장 조준’ 노타, 온디바이스 최적화 기술로 로보틱스 영역 확장 가속화한다

온디바이스AIVLA모델로보틱스엣지AI모델최적화추론최적화NPU피지컬AI
노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”테크월드
2026. 5. 29. 오전 9:00

노타 “퀄컴 최신 엣지 AI 디바이스서 피지컬 AI 모델 최적화 성공”

피지컬AI엣지AIVLA모델온디바이스AI로봇NPU최적화임베디드추론최적화
투게더AI, 2비트 KV 캐시 압축 ‘OSCAR’ 오픈소스 공개…긴 문맥 AI 추론 비용 낮춘다AI 매터스
2026. 5. 27. 오전 10:56

투게더AI, 2비트 KV 캐시 압축 ‘OSCAR’ 오픈소스 공개…긴 문맥 AI 추론 비용 낮춘다

KV캐시압축양자화오픈소스언어모델추론최적화긴문맥처리GPU효율화서빙시스템
나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발테크월드
2026. 5. 20. 오후 3:33

나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발

AI플랫폼에이전트엔터프라이즈오픈소스클라우드GPULLM보안
“하루 1조 토큰 시대”…구글, ‘가성비 AI’ 제미나이 3.5 플래시 공개한겨레
2026. 5. 20. 오후 2:50

“하루 1조 토큰 시대”…구글, ‘가성비 AI’ 제미나이 3.5 플래시 공개

생성형AI경량모델LLM비용절감에이전트멀티모달영상생성음성인식