IT뉴스모아news terminal

article detail

[딜라이트닷넷] "가볍고 빠르게"…글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

네이트AI경량화GPU효율성모델최적화비용절감소형언어모델엣지컴퓨팅추론성능피지컬AI
2026. 4. 15. 오후 4:07
[딜라이트닷넷] "가볍고 빠르게"…글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

AI 요약

바야흐로 '인공지능(AI) 다이어트' 시대로, 구글, 오픈AI, 앤트로픽 등 글로벌 AI 선두 기업들이 성능은 유지하면서 크기와 비용을 획기적으로 줄인 소형언어모델(SLM) 경쟁을 벌이고 있습니다. 이는 GPU 공급 부족과 제조업 현장에 탑재되는 피지컬AI 수요로 인프라 비용 절감과 단일 칩 수준에서 구동되는 경량화 모델이 필요해졌기 때문입니다. 오픈AI는 지난달 GPT5.4 미니·나노(예: 미니 입력토큰 100만개당 0.75달러·출력 100만개당 4.50달러, 나노 입력 100만개당 0.20달러·출력 100만개당 1.25달러)를, 구글은 지난 2일 젬마4(아파치 2.0 라이선스·E2B~31B·소형 E4B는 네이티브 오디오·비전 처리)를, 앤트로픽은 클로드 4.5 하이쿠(입력 100만개당 1달러·출력 100만개당 5달러)와 소넷 4.5를 공개했으며 전문가들은 이번 경량화 경쟁이 AI 산업의 수익 구조를 바꾸고 경쟁의 초점을 지연시간과 비용으로 전환하고 있다고 보고 있습니다.

원문보기
feed://articles/related관련 기사
美 유니콘 손잡은 스퀴즈비츠…"AI 경량화 기술, 북미시장 공략"유니콘팩토리
2026. 4. 8. 오후 12:30

美 유니콘 손잡은 스퀴즈비츠…"AI 경량화 기술, 북미시장 공략"

AI경량화모델최적화추론성능디퓨전모델AI인프라멀티모달프로그래밍언어기술협력
스퀴즈비츠, 美 유니콘 기업 모듈라와 글로벌 AI 인프라 시장 공략 가속인공지능신문
2026. 4. 8. 오전 8:33

스퀴즈비츠, 美 유니콘 기업 모듈라와 글로벌 AI 인프라 시장 공략 가속

AI경량화AI인프라모델최적화디퓨전모델멀티모달추론성능커뮤니티
'AI 경량화' 노타, 1Q 수주액 118억…전년 동기 대비 111% 증가v.daum.net
2026. 4. 7. 오전 8:31

'AI 경량화' 노타, 1Q 수주액 118억…전년 동기 대비 111% 증가

AI경량화모델최적화영상분석VLM엣지컴퓨팅수주증가플랫폼솔루션데이터센터
AI 휴먼이 로봇 팔 조종…이스트소프트, 피지컬 AI 사업 본격화v.daum.net
2026. 4. 15. 오후 5:16

AI 휴먼이 로봇 팔 조종…이스트소프트, 피지컬 AI 사업 본격화

AI휴먼피지컬AI로봇팔엣지컴퓨팅로보틱스시뮬레이션VR대화형AI
문서 시장에 확산된 '터보퀀트'…사이냅소프트, AI 서비스 비용 낮췄다v.daum.net
2026. 4. 15. 오후 5:16

문서 시장에 확산된 '터보퀀트'…사이냅소프트, AI 서비스 비용 낮췄다

AI최적화벡터양자화OCRKV캐시압축추론성능온프레미스비용절감문서처리
사이냅소프트, 구글 AI 기술 ‘터보퀀트’ 발 빠르게 적용… ‘사이냅 OCR IX’ 메모리 효율 극대화인공지능신문
2026. 4. 15. 오전 11:39

사이냅소프트, 구글 AI 기술 ‘터보퀀트’ 발 빠르게 적용… ‘사이냅 OCR IX’ 메모리 효율 극대화

문서AIOCR양자화벡터압축메모리최적화추론성능GPU활용비용절감
이스트소프트, AI 휴먼 서비스‘페르소 인터랙티브’에 피지컬 AI 결합테크월드
2026. 4. 15. 오전 11:10

이스트소프트, AI 휴먼 서비스‘페르소 인터랙티브’에 피지컬 AI 결합

AI휴먼페르소피지컬AI로봇엣지컴퓨팅대화형AI로보틱스SDK
이스트소프트, 캐나다 로봇 AI 기업 ‘M2M Tech’와 전략적 협업… 실시간 대화형 AI 휴먼 서비스 ‘페르소 인터랙티브’, 피지컬 AI와 결합인공지능신문
2026. 4. 15. 오전 10:33

이스트소프트, 캐나다 로봇 AI 기업 ‘M2M Tech’와 전략적 협업… 실시간 대화형 AI 휴먼 서비스 ‘페르소 인터랙티브’, 피지컬 AI와 결합

피지컬AI대화형AI로봇엣지컴퓨팅휴먼서비스로보틱스디지털트윈에이전틱AI
딥엑스, 2027년 2나노 AI칩 'DX-M2'양산 로드맵 공개전자신문
2026. 4. 14. 오후 1:41

딥엑스, 2027년 2나노 AI칩 'DX-M2'양산 로드맵 공개

AI칩반도체나노공정저전력생성형AI피지컬AI데이터센터엣지컴퓨팅
"엔비디아 20배 전력효율"…딥엑스, 피지컬 AI 시장 정조준연합뉴스
2026. 4. 14. 오후 12:19

"엔비디아 20배 전력효율"…딥엑스, 피지컬 AI 시장 정조준

AI반도체전력효율피지컬AI엣지컴퓨팅저전력칩생성형AI반도체공정생태계협력
"10년간 1억4500만대 쏟아진다"…지구촌 뒤덮는 '피지컬 AI'한국경제
2026. 4. 10. 오후 1:55

"10년간 1억4500만대 쏟아진다"…지구촌 뒤덮는 '피지컬 AI'

피지컬AI자율주행차로봇드론휴머노이드로보택시엣지컴퓨팅반도체
“피지컬 AI 기기 누적 출하량, 2035년까지 1억4500만대 달할 것”로봇신문
2026. 4. 10. 오후 3:43

“피지컬 AI 기기 누적 출하량, 2035년까지 1억4500만대 달할 것”

피지컬AI로보틱스자율주행드론생성형AI엣지컴퓨팅반도체휴머노이드