IT뉴스모아news terminal

article detail

[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

디지털데일리AI경쟁GPU경량화모델대형언어모델비용최적화생성AI소형언어모델엣지디바이스
2026. 4. 15. 오후 4:06
[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

AI 요약

무겁고 비싼 대형언어모델(LLM) 대신 필요한 성능을 유지하면서 크기와 비용을 줄인 소형언어모델(SLM) 경쟁이 다시 가열되고 있으며, 업계는 GPU 공급 부족과 피지컬AI의 엣지 디바이스 수요로 경량화 모델 중요성이 커지고 있다고 15일 전했습니다. 오픈AI는 지난달 GPT‑5.4 미니·나노를 공개해 입력 토큰 100만개당 0.75달러(미니)·0.20달러(나노), 출력 토큰 100만개당 4.50달러·1.25달러의 비용을 제시했고, 구글은 아파치 2.0 라이선스의 젬마4 시리즈(엣지용 E2B부터 전문가용 31B까지, 소형 E4B는 네이티브 오디오·비전 처리 지원)를 공개했으며, 앤트로픽은 클로드 4.5 하이쿠와 소넷 4.5의 복합 사용법과 함께 입력 100만개당 1달러·출력 100만개당 5달러의 요금을 내세웠습니다. 전문가들은 이번 경량화 경쟁이 AI 산업의 수익 구조를 근본적으로 바꾸고 시장 경쟁이 지연시간과 비용 중심으로 전환되고 있다고 보고 있습니다.

원문보기
feed://articles/related관련 기사
클로드, 기업 시장서 오픈AI 맹추격…“두 달 내 역전” 전망까지mstoday.co.kr
2026. 4. 13. 오전 10:45

클로드, 기업 시장서 오픈AI 맹추격…“두 달 내 역전” 전망까지

대형언어모델AI경쟁기업도입시장점유클로드오픈AI생성AI
[박철완의 마켓 나우] AI 경쟁, 전력망에서 토큰으로 이동 중네이트
2026. 5. 8. 오전 12:05

[박철완의 마켓 나우] AI 경쟁, 전력망에서 토큰으로 이동 중

AI경쟁토큰효율LLM에이전트맥락처리비용최적화모델성능토큰경제
‘공동의 적’ 오픈AI 겨냥…머스크·앤스로픽 손 잡았다서울경제
2026. 5. 7. 오후 5:44

‘공동의 적’ 오픈AI 겨냥…머스크·앤스로픽 손 잡았다

생성AI데이터센터GPU연산인프라클라우드컴퓨팅경쟁제휴AI칩서비스확장
대형 출판사들 메타에 소송···“AI 무단 학습에 저작권 침해”경향신문
2026. 5. 6. 오후 3:37

대형 출판사들 메타에 소송···“AI 무단 학습에 저작권 침해”

저작권침해AI학습집단소송대형언어모델출판사생성AI
[양현상 칼럼] AI 반도체 패권의 진짜 승부처AI타임스
2026. 5. 6. 오전 11:55

[양현상 칼럼] AI 반도체 패권의 진짜 승부처

AI반도체GPUHBM메모리데이터센터추론엣지디바이스패키징
딥시크 이어 샤오미까지…中, ‘AI 모델+국산 칩’ 결합 가속v.daum.net
2026. 4. 29. 오후 2:42

딥시크 이어 샤오미까지…中, ‘AI 모델+국산 칩’ 결합 가속

AI모델국산칩반도체GPU대형언어모델자급화중국기업협업전략
딥시크의 귀환… ‘가성비 AI’로 빅테크 위협IT조선
2026. 4. 26. 오후 4:41

딥시크의 귀환… ‘가성비 AI’로 빅테크 위협

대형언어모델AI경쟁가성비중국AI코드생성추론능력멀티모달반도체
“개발자 1천 명 몰렸다”⋯ 엔비디아가 한국서 선보인 ‘AI 에이전트’브릿지경제
2026. 4. 26. 오후 4:18

“개발자 1천 명 몰렸다”⋯ 엔비디아가 한국서 선보인 ‘AI 에이전트’

AI에이전트엔비디아DGX스파크개발자행사GPU대형언어모델로컬환경쿠다생태계
구글, 앤트로픽에 400억달러 투입…AI 패권 경쟁 격화v.daum.net
2026. 4. 25. 오전 6:02

구글, 앤트로픽에 400억달러 투입…AI 패권 경쟁 격화

AI투자스타트업대규모투자생성형AI클라우드AI경쟁대형언어모델기술패권
'글자 깨짐' 완벽 해결…오픈AI, 이미지 AI 왕좌 탈환seoulwire.com
2026. 4. 23. 오전 10:32

'글자 깨짐' 완벽 해결…오픈AI, 이미지 AI 왕좌 탈환

이미지생성AI텍스트렌더링추론기반모델멀티랭귀지이미지아레나챗GPTAI경쟁생성AI
“생각하고 그린다”… 오픈AI, ‘추론’ 더한 챗GPT 이미지 2.0 공개더에이아이
2026. 4. 22. 오전 9:54

“생각하고 그린다”… 오픈AI, ‘추론’ 더한 챗GPT 이미지 2.0 공개

이미지생성추론엔진생성AI텍스트렌더링멀티모달AI경쟁디자인자동화
Koo pushes AI shift, global AI hub네이트
2026. 4. 17. 오전 9:06

Koo pushes AI shift, global AI hub

AI허브소형언어모델대형언어모델조선업글로벌투자산업경쟁력성장불평등한국AI정책