IT뉴스모아news terminal

article detail

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

v.daum.netGPU최적화LLMOpsNPU지원메모리최적화분산서빙생성형AI추론플랫폼토큰처리
2026. 5. 29. 오전 10:51
GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

AI 요약

오케스트로는 생성형 AI 서비스 확산으로 증가한 추론 수요에 대응하기 위해 29일 AI 추론 운영 플랫폼 '콘체르토 AI'를 공개했습니다. 콘체르토 AI는 질문 분석과 답변 생성 분리, 분산 서빙, KV Cache 최적화 및 메모리 재사용, 실시간 대기열과 지능형 라우팅 등을 통해 GPU·NPU 자원을 작업 특성에 맞게 배분해 초기 응답 시간과 토큰 처리 속도를 개선하고 고부하 환경에서 기존 단일 처리 대비 토큰 출력 속도를 2.2배 향상시켰습니다. 또한 LLMOps 전 과정을 단일 플랫폼에서 자동화하고 쿠버네티스 기반 배포와 통합 모니터링을 지원하며 엔비디아 GPU뿐 아니라 리벨리온·퓨리오사AI 등 국산 NPU를 포함한 이기종 가속기를 지원해 프라이빗 AI와 소버린 AI 환경에서 하드웨어 의존도를 낮추는 것을 목표로 합니다.

원문보기
feed://articles/related관련 기사
오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 공개…GPU 활용률 높인다전자신문
2026. 5. 29. 오전 10:52

오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 공개…GPU 활용률 높인다

AI추론플랫폼GPU활용LLMOps분산서빙가속기토큰처리프라이빗AI
오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 출시서울파이낸스
2026. 5. 29. 오후 4:47

오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 출시

AI추론LLMOps분산서빙GPU인프라캐시최적화온프레미스가속기프라이빗AI
GPU 확보보다 효율…오케스트로 '콘체르토 AI' 출시경제타임스
2026. 5. 29. 오후 4:30

GPU 확보보다 효율…오케스트로 '콘체르토 AI' 출시

AI추론효율화GPU최적화분산처리플랫폼병목해결토큰처리프라이빗AI
"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개 - 머니투데이머니투데이
2026. 5. 29. 오후 1:00

"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개 - 머니투데이

AI추론플랫폼GPU최적화분산처리가속기병목해소토큰처리온프레미스
오케스트로, GPU 활용 효율 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공플래텀(Platum)
2026. 5. 29. 오전 8:58

오케스트로, GPU 활용 효율 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공

AI추론GPU최적화LLMOps분산처리가속기캐시최적화이기종지원성능모니터링
퓨리오사AI·브로드컴, 차세대 AI 추론 플랫폼 개발 착수연합뉴스
2026. 5. 28. 오후 3:09

퓨리오사AI·브로드컴, 차세대 AI 추론 플랫폼 개발 착수

AI가속기칩렛추론플랫폼파트너십HBM공정기술데이터센터토큰처리
GS네오텍, ‘AWS 서밋 서울’ 참가 … AI 및 보안 거버넌스 선봬뉴데일리 경제
2026. 5. 22. 오전 8:46

GS네오텍, ‘AWS 서밋 서울’ 참가 … AI 및 보안 거버넌스 선봬

생성형AI보안거버넌스AI에이전트LLM클라우드인프라GPU최적화솔루션AWS
"실리콘밸리 유니콘 경험 이식"…프렌들리AI, 글로벌 스케일업 시동 - 머니투데이머니투데이
2026. 5. 5. 오전 5:00

"실리콘밸리 유니콘 경험 이식"…프렌들리AI, 글로벌 스케일업 시동 - 머니투데이

생성형AIGPU최적화추론엔진스케일업벤처투자AI솔루션성능최적화조직문화
구글 클라우드 "기업용 AI 이용자 수 1분기 40% 증가"v.daum.net
2026. 4. 22. 오후 9:01

구글 클라우드 "기업용 AI 이용자 수 1분기 40% 증가"

클라우드생성형AI엔터프라이즈AI에이전트APITPU사이버보안토큰처리
프렌들리AI CBO “북미 추론 시장 공략…2년 내 매출 100배 확대”전자신문
2026. 4. 16. 오후 3:33

프렌들리AI CBO “북미 추론 시장 공략…2년 내 매출 100배 확대”

AI추론GPU최적화추론인프라레이턴시배칭기술토큰처리AI플랫폼북미시장
[AI픽] LGU+, AWS 손잡고 AI 운영 자동화 플랫폼 구축연합뉴스
2026. 4. 10. 오전 9:00

[AI픽] LGU+, AWS 손잡고 AI 운영 자동화 플랫폼 구축

AI운영자동화생성형AI클라우드하이브리드MLOps쿠버네티스GPU최적화인프라구축
"챗봇은 끝났다"…오픈AI, 챗GPT 엔터프라이즈 '실행형 에이전트'로 재정의네이트
2026. 5. 30. 오전 6:01

"챗봇은 끝났다"…오픈AI, 챗GPT 엔터프라이즈 '실행형 에이전트'로 재정의

에이전트AI챗봇생성형AI업무자동화워크플로우엔터프라이즈커스텀GPT보안