IT뉴스모아news terminal

article detail

[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

디지털데일리AI경쟁GPU경량화모델대형언어모델비용최적화생성AI소형언어모델엣지디바이스

2026. 4. 15. 오후 4:06

[딜라이트닷넷] “가볍고 빠르게”… 글로벌 AI 빅테크, 경량화 모델 전쟁 2차전 돌입

AI 요약

무겁고 비싼 대형언어모델(LLM) 대신 필요한 성능을 유지하면서 크기와 비용을 줄인 소형언어모델(SLM) 경쟁이 다시 가열되고 있으며, 업계는 GPU 공급 부족과 피지컬AI의 엣지 디바이스 수요로 경량화 모델 중요성이 커지고 있다고 15일 전했습니다. 오픈AI는 지난달 GPT‑5.4 미니·나노를 공개해 입력 토큰 100만개당 0.75달러(미니)·0.20달러(나노), 출력 토큰 100만개당 4.50달러·1.25달러의 비용을 제시했고, 구글은 아파치 2.0 라이선스의 젬마4 시리즈(엣지용 E2B부터 전문가용 31B까지, 소형 E4B는 네이티브 오디오·비전 처리 지원)를 공개했으며, 앤트로픽은 클로드 4.5 하이쿠와 소넷 4.5의 복합 사용법과 함께 입력 100만개당 1달러·출력 100만개당 5달러의 요금을 내세웠습니다. 전문가들은 이번 경량화 경쟁이 AI 산업의 수익 구조를 근본적으로 바꾸고 시장 경쟁이 지연시간과 비용 중심으로 전환되고 있다고 보고 있습니다.

클로드, 기업 시장서 오픈AI 맹추격…“두 달 내 역전” 전망까지

2026. 4. 13. 오전 10:45

클로드, 기업 시장서 오픈AI 맹추격…“두 달 내 역전” 전망까지

대형언어모델AI경쟁기업도입시장점유클로드오픈AI생성AI

‘건설중’ LGU+ AI 데이터센터, 서버 계약은 벌써 완판됐다

2026. 6. 8. 오전 12:02

‘건설중’ LGU+ AI 데이터센터, 서버 계약은 벌써 완판됐다

AI데이터센터GPU하이퍼스케일생성AI냉각기술서버전력효율PMDC

월마트가 직접 만든 AI 코딩 에이전트 인기..."빅테크 종속 깬다"

2026. 6. 6. 오후 7:36

월마트가 직접 만든 AI 코딩 에이전트 인기..."빅테크 종속 깬다"

AI코딩에이전트대형언어모델플랫폼중립코드생성기업AI종속회피비용최적화

AI 인프라 경쟁 격화…구글은 GPU 빌리고, 트럼프는 오픈AI 지분 검토

2026. 6. 6. 오전 4:55

AI 인프라 경쟁 격화…구글은 GPU 빌리고, 트럼프는 오픈AI 지분 검토

AI인프라GPU데이터센터엔비디아오픈AI기업공개정부지분AI경쟁

AI 시대에는 집도 데이터센터가 된다

2026. 6. 4. 오전 10:45

AI 시대에는 집도 데이터센터가 된다

AI경쟁데이터센터전력인프라원전분산컴퓨팅에너지GPU칩

마이크로소프트, 첫 자체 추론 AI 모델 공개…오픈AI와 시너지 극대화

2026. 6. 3. 오전 11:30

마이크로소프트, 첫 자체 추론 AI 모델 공개…오픈AI와 시너지 극대화

추론모델생성AI클라우드GPUAI워크스테이션오픈소스음성처리이미지생성

MS, 클라우드 안 거치고 AI 에이전트 구동…윈도 온디바이스 AI 강화

디지털데일리

2026. 6. 3. 오전 5:34

MS, 클라우드 안 거치고 AI 에이전트 구동…윈도 온디바이스 AI 강화

온디바이스AI클라우드소형언어모델AI에이전트윈도GPU로컬모델개발환경

빅테크 'AI 무제한 투자 시대' 종료… 비용 폭탄에 AI 배급제 돌입

글로벌이코노믹

2026. 6. 2. 오전 3:15

빅테크 'AI 무제한 투자 시대' 종료… 비용 폭탄에 AI 배급제 돌입

AI연산비용토큰사용량AI배급제비용통제경량화모델ASICHBMGPU

알리바바, 자체 AI 칩 ‘젠우 M890’ 발표… 엔비디아 대체 속도

디지털데일리

2026. 5. 21. 오전 8:12

알리바바, 자체 AI 칩 ‘젠우 M890’ 발표… 엔비디아 대체 속도

AI칩GPU가속기대형언어모델추론학습슈퍼노드반도체

“AI가 알리바바 성장엔진 됐다”…알리바바 클라우드 매출 40% 급증, AI 사업 본격 수익화

인공지능신문

2026. 5. 16. 오후 6:58

“AI가 알리바바 성장엔진 됐다”…알리바바 클라우드 매출 40% 급증, AI 사업 본격 수익화

클라우드AI대형언어모델에이전트MaaSGPU반도체전자상거래

국방부-SK텔레콤, 국방특화 AI 모델 개발 협력…국방 AX 속도 내며 보안 강화도 과제로

데일리시큐

2026. 5. 15. 오후 2:02

국방부-SK텔레콤, 국방특화 AI 모델 개발 협력…국방 AX 속도 내며 보안 강화도 과제로

AI파운데이션국방AI경량화모델GPU보안강화문서분석작전지원데이터보호

국방부, SKT과 손잡고 ‘국가대표 AI’ 국방 최초 도입

2026. 5. 14. 오후 8:43

국방부, SKT과 손잡고 ‘국가대표 AI’ 국방 최초 도입

AI파운데이션국방AIGPU모델개발산학협력공개데이터경량화모델AI고도화