IT뉴스모아news terminal

article detail

오케스트로, GPU 활용 효율 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공

플래텀(Platum)AI추론GPU최적화LLMOps가속기분산처리성능모니터링이기종지원캐시최적화
2026. 5. 29. 오전 8:58
오케스트로, GPU 활용 효율 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI’ 공

AI 요약

AI·클라우드 소프트웨어 전문기업 오케스트로가 보유 GPU 인프라의 활용 효율을 높이는 AI 추론 운영 플랫폼 ‘콘체르토 AI(CONCERTO A.I.)’를 공개했습니다. 콘체르토 AI는 대규모 추론 요청을 분산 처리하고 GPU·NPU 등 가속기 자원을 작업 특성에 맞춰 배분해 응답 지연과 자원 낭비를 줄이며, 질문 분석과 답변 생성 작업을 분리하는 분산 서빙 기반 최적화와 키-값 캐시 최적화·메모리 재사용·실시간 지능형 라우팅 기능을 결합해 병목을 줄입니다. 자체 벤치마크에서 고부하 환경 기준 토큰 출력 속도가 기존 단일 처리 방식 대비 2.2배 빨라졌고, 모델 배포부터 추론 요청 처리·자원 배분·성능 모니터링까지 LLMOps 기능을 제공하며 리벨리온·퓨리오사AI 등 국산 NPU까지 아우르는 이기종 가속기 지원으로 특정 하드웨어 벤더 의존도를 낮출 수 있어 국내에서 GPU와 국산 NPU를 아우르는 상용화 수준의 AI 추론 운영 플랫폼은 콘체르토 AI가 유일하다고 회사 측은 설명했습니다.

원문보기
feed://articles/related관련 기사
오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 출시서울파이낸스
2026. 5. 29. 오후 4:47

오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 출시

AI추론LLMOps분산서빙GPU인프라캐시최적화온프레미스가속기프라이빗AI
"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개 - 머니투데이머니투데이
2026. 5. 29. 오후 1:00

"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개 - 머니투데이

AI추론플랫폼GPU최적화분산처리가속기병목해소토큰처리온프레미스
"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개유니콘팩토리
2026. 5. 29. 오후 12:00

"같은 GPU로 2.2배 더 빠르게"…오케스트로 '콘체르토 AI' 공개

AI추론플랫폼분산처리GPU최적화토큰생성온프레미스추론최적화가속기
GPU 확보보다 효율…오케스트로 '콘체르토 AI' 출시경제타임스
2026. 5. 29. 오후 4:30

GPU 확보보다 효율…오케스트로 '콘체르토 AI' 출시

AI추론효율화GPU최적화분산처리플랫폼병목해결토큰처리프라이빗AI
오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 공개…GPU 활용률 높인다전자신문
2026. 5. 29. 오전 10:52

오케스트로, AI 추론 운영 플랫폼 '콘체르토 AI' 공개…GPU 활용률 높인다

AI추론플랫폼GPU활용LLMOps분산서빙가속기토큰처리프라이빗AI
GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개v.daum.net
2026. 5. 29. 오전 10:51

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

추론플랫폼생성형AIGPU최적화LLMOps분산서빙토큰처리NPU지원메모리최적화
[美증시 특징주] AI클라우드업체 네비우스 14% 폭등...에이전AI 인수가 촉매미디어펜
2026. 5. 5. 오전 5:05

[美증시 특징주] AI클라우드업체 네비우스 14% 폭등...에이전AI 인수가 촉매

AI클라우드인수합병GPU최적화AI추론토큰생성엔비디아클라우드서비스주가상승
프렌들리AI CBO “북미 추론 시장 공략…2년 내 매출 100배 확대”전자신문
2026. 4. 16. 오후 3:33

프렌들리AI CBO “북미 추론 시장 공략…2년 내 매출 100배 확대”

AI추론GPU최적화추론인프라레이턴시배칭기술토큰처리AI플랫폼북미시장
프렌들리AI, 몰로코 출신 브라이언 유 CBO 영입…AI 추론 시장 공략 강화AI타임스
2026. 4. 9. 오후 5:11

프렌들리AI, 몰로코 출신 브라이언 유 CBO 영입…AI 추론 시장 공략 강화

AI추론추론엔진GPU최적화LLM비용절감고투마켓파트너십인사영입
인텔·삼바노바, 이기종 AI 추론 플랫폼 개발을 위해 협력AI타임스
2026. 4. 9. 오전 11:50

인텔·삼바노바, 이기종 AI 추론 플랫폼 개발을 위해 협력

AI추론이기종GPU가속기에이전트AI벡터DB제온프로에너지효율
프렌들리AI, 몰로코 출신 브라이언 유 CBO 영입…해외 공략 박차전자신문
2026. 4. 9. 오전 9:20

프렌들리AI, 몰로코 출신 브라이언 유 CBO 영입…해외 공략 박차

AI추론GPU최적화글로벌확장SaaS스타트업인프라배칭기술고투마켓
프렌들리AI, 브라이언 유 CBO 영입…AI 추론 인프라 글로벌 확장 속도유니콘팩토리
2026. 4. 9. 오전 9:00

프렌들리AI, 브라이언 유 CBO 영입…AI 추론 인프라 글로벌 확장 속도

AI추론클라우드인프라GPU최적화엔터프라이즈글로벌확장배칭기술