article detail
알리바바, AI 모델 2종 동시 공개…에이전틱 코딩·멀티모달 통합 역량 강화
2026. 4. 6. 오전 8:31

AI 요약
알리바바 그룹이 에이전틱 코딩과 멀티모달 추론에 특화된 Qwen3.6-Plus와 텍스트·음성·이미지·영상을 단일 모델로 처리하는 Qwen3.5-Omni(Plus·Flash·Light)를 공개했습니다. Qwen3.6-Plus는 '능력 루프(Capability Loop)' 구조로 기본 100만 토큰 컨텍스트 창을 지원하며 UI 스크린샷·손그림 와이어프레임을 해석해 프론트엔드 코드를 생성하는 시각적 코딩 기능을 포함하고 Model Studio·Qwen Chat 및 외부 코딩 도구와 호환되며 일부 큰 3.6 모델은 오픈소스로 공개할 계획입니다. Qwen3.5-Omni는 최대 256K 토큰 컨텍스트를 지원하는 옴니모달 모델로, 최상위 Qwen3.5-Omni-Plus는 200개 이상의 벤치마크에서 구글 제미나이 3.1 프로보다 음성 이해·추론·다국어 번역 등에서 높은 성능을 기록했으며 음성 인식 113개 언어·방언, 음성 생성 36개 언어·방언을 지원하고 10시간 이상의 연속 오디오 처리가 가능하며 오디오-비주얼 바이브 코딩 기능을 제공합니다.






