IT뉴스모아news terminal

article detail

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

AI타임스MoE경량모델도구호출에이전트오픈소스온디바이스AI추론최적화환각억제

2026. 5. 30. 오후 12:55

리퀴드 AI, 온디바이스용 모델 ‘LFM2.5-8B-A1B’ 공개…환각 줄고 추론 대폭 강화

AI 요약

리퀴드 AI는 28일(현지시간) 소비자용 하드웨어에서 실행할 수 있는 도구 호출과 에이전트 작업에 최적화된 전문가 혼합(MoE) 모델 'LFM2.5-8B-A1B'를 공개했으며, 총 83억개(8.3B) 매개변수 중 실제 추론에서는 15억개(1.5B)만 활성화되는 희소 구조로 노트북과 스마트폰에서도 실행 가능한 연산 효율을 확보했다고 설명했습니다. 새 모델은 최대 12만8000토큰의 장문 컨텍스트와 38조 토큰의 사전학습 데이터를 지원하고 어휘 사전 규모를 12만8000개로 확대했으며, 추론 전용 설계와 강화학습 기반 환각 억제 기법을 적용해 아티피셜 애널리시스 비환각률이 7.46에서 63.47로 개선되는 등 성능 향상을 보였습니다. 실행 성능은 애플 M5 맥스에서 초당 253토큰, AMD 라이젠 AI 맥스+ 395에서는 초당 146토큰, 스마트폰에서는 초당 약 30토큰, 단일 엔비디아 H100에서는 초당 1만8500토큰을 기록했고 모델 가중치는 허깅페이스에서 공개되며 연간 매출 1000만달러 미만의 기업·개인은 상업적으로 무료로 이용할 수 있습니다.

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

2026. 4. 24. 오전 8:00

3B만 깨워도 35B처럼 생각한다 [정원훈의 AI 트렌드]

경량모델MoE구조에이전트컨텍스트오픈소스멀티모달코딩능력추론최적화

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

인공지능신문

2026. 6. 4. 오후 5:27

"클라우드 밖으로 나온 AI"…구글, 온디바이스 오픈모델 '젬마 4 12B' 전격 공개

온디바이스AI경량모델멀티모달오픈모델엣지AI로컬구동추론최적화오디오입력

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

2026. 4. 22. 오후 3:30

페르소나AI, 피지컬 AI 휴머노이드 로봇 OS 공개

휴머노이드로봇로봇OS온디바이스AI음성인식에이전트물리AI경량모델멀티모달

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

2026. 4. 17. 오전 6:00

클로드의 8% 가격으로 코딩한다고? [정원훈의 AI 트렌드]

경량모델MoE구조코딩성능API가격로봇비전에이전트추론최적화멀티모달

구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.

2026. 4. 8. 오후 7:07

구글이 개인 기기에서 오프라인으로 실행되는 AI 엔진인 젬마 4(Gemma 4)를 출시했습니다.

온디바이스AI경량모델오픈소스개인정보보호오프라인실행엣지컴퓨팅생성AI모바일AI

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

매일경제 마켓

2026. 4. 7. 오전 6:13

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스라이선스온디바이스추론에이전트

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

2026. 4. 7. 오전 6:15

개방·경량 AI 경쟁 본격화…구글 젬마4 확산

개방형AI경량모델오픈소스생태계에이전트온디바이스LLM

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

연합인포맥스

2026. 6. 8. 오후 1:01

서울대 찾은 젠슨 황 "K만 붙이면 유명해진다…나는 K-젠슨"

AI엔비디아칩설계LLM오픈소스로봇에이전트신약개발

[안광섭 AI 진테제] 미국기업이 중국AI기업에 돈을 보내는 이유

2026. 6. 6. 오전 9:36

[안광섭 AI 진테제] 미국기업이 중국AI기업에 돈을 보내는 이유

AI코딩에이전트토큰가격딥시크오픈소스API가격장문맥비용절감

NVIDIA, 피지컬 AI를 위한 대규모 오픈소스 에이전트 도구와 스킬 모음 공개

NVIDIA Blog Korea

2026. 6. 4. 오후 4:41

NVIDIA, 피지컬 AI를 위한 대규모 오픈소스 에이전트 도구와 스킬 모음 공개

피지컬AI오픈소스에이전트로보틱스자율주행디지털트윈시뮬레이션합성데이터

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

2026. 6. 4. 오전 8:53

노타, 이기종 컴퓨팅 기반 LLM 최적화 구현…"실행효율 제고 노력"

LLM이기종컴퓨팅추론최적화AIPCNPUGPU온디바이스AI에너지효율