IT뉴스모아news terminal

article detail

알리바바, 호퍼 GPU에서 모델 속도 3배 향상하는 ‘플래시QLA’ 공개

AI타임스GPU최적화대형언어모델선형어텐션어텐션커널연산효율오픈소스컨텍스트병렬화호퍼GPU
2026. 5. 4. 오후 4:34
알리바바, 호퍼 GPU에서 모델 속도 3배 향상하는 ‘플래시QLA’ 공개

AI 요약

대형언어모델 성능 경쟁이 GPU 커널 영역으로 확장되며 알리바바가 29일(현지시간) 엔비디아 호퍼 GPU에서 최대 3배의 속도 향상을 구현할 수 있는 고성능 선형 어텐션 커널 라이브러리 플래시QLA를 공개하고 코드를 깃허브에서 오픈소스로 제공했습니다. 플래시QLA는 GDN(Gated Delta Network) 기반 선형 어텐션에 맞춰 최적화돼 입력 길이 n에 따른 연산을 n²에서 n 수준으로 줄이며, 트리톤 기반 커널과 비교해 순방향에서 최대 2~3배, 역방향에서 2배 빠른 성능을 구현했습니다. 지수 감쇠 특성을 이용한 컨텍스트 병렬화, 텐서 코어·CUDA 코어·SFU 부담을 줄이는 계산 재구성, 타일랭 기반 커널 설계 등의 기술로 연산 효율을 높여 긴 문서 처리 비용과 AI 서비스 운영 비용 절감에 기여하고, 전문가들은 이번 발표를 미국의 AI 칩 수출 제재에 대한 소프트웨어 돌파구로 해석하고 있습니다.

원문보기
feed://articles/related관련 기사
한국 스타트업 비드래프트, GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 기록전자신문
2026. 5. 19. 오후 1:40

한국 스타트업 비드래프트, GPU 추가 학습 없이 글로벌 AI 추론 성능 3위 기록

대형언어모델모델병합추론성능AI기술스타트업특허출원오픈소스벤치마크
“이젠 금융도 한류”…BC카드, 미국서 ‘K-금융 AI 혁신’ 전세계에 알려v.daum.net
2026. 5. 18. 오후 3:36

“이젠 금융도 한류”…BC카드, 미국서 ‘K-금융 AI 혁신’ 전세계에 알려

AI혁신금융기술언어모델오픈소스결제시스템운영효율GPU최적화글로벌진출
BC카드, 美 '레드햇 서밋'에서 에이전틱 AI 사례 발표v.daum.net
2026. 5. 18. 오전 10:54

BC카드, 美 '레드햇 서밋'에서 에이전틱 AI 사례 발표

에이전틱AILLMSLM금융AI오픈소스GPU최적화결제데이터플랫폼
"GPU 70% 줄였다"…BC카드, 美서 에이전틱 AI 운영 플랫폼 공개nocutnews.co.kr
2026. 5. 18. 오전 10:20

"GPU 70% 줄였다"…BC카드, 美서 에이전틱 AI 운영 플랫폼 공개

에이전틱AI소형언어모델GPU최적화금융AI오픈소스추론성능비용절감LLM
‘엔비디아·클라우드·GPU’ 없이… AI가 책상 위로 [정원훈의 AI 트렌드]IT조선
2026. 5. 15. 오전 6:00

‘엔비디아·클라우드·GPU’ 없이… AI가 책상 위로 [정원훈의 AI 트렌드]

AI경량화엣지AI오픈소스비디오생성멀티모달GPU최적화파인튜닝모바일AI
인재 확보 수십조원 쏟은 메타, 새 AI ‘뮤즈’로 자존심 살릴까경향신문
2026. 4. 9. 오후 9:02

인재 확보 수십조원 쏟은 메타, 새 AI ‘뮤즈’로 자존심 살릴까

AI모델멀티모달추론능력벤치마크오픈소스메타연산효율과학분야
"中 AI모델 , 미국 빅테크 못 이긴다"…골드만삭스 전망네이트
2026. 5. 19. 오후 9:23

"中 AI모델 , 미국 빅테크 못 이긴다"…골드만삭스 전망

AI모델빅테크인프라투자오픈소스에이전트AI데이터센터반도체토큰비용
"중국 AI는 미국에 못 당한다"…골드만삭스 분석아이뉴스24
2026. 5. 19. 오후 8:21

"중국 AI는 미국에 못 당한다"…골드만삭스 분석

AI경쟁미국중국오픈소스하이퍼스케일러기업용AI토큰소비매출총이익
"중국 AI는 미국에 못 당한다"…골드만삭스 분석v.daum.net
2026. 5. 19. 오후 8:23

"중국 AI는 미국에 못 당한다"…골드만삭스 분석

AI경쟁미국기업중국AI오픈소스하이퍼스케일러기업용시장인프라투자AI모델
"中 AI모델 , 미국 빅테크 못 이긴다"…골드만삭스 전망아시아경제
2026. 5. 19. 오후 9:22

"中 AI모델 , 미국 빅테크 못 이긴다"…골드만삭스 전망

AI모델미국빅테크중국AI오픈소스에이전트AI데이터센터반도체토큰비용
'AI 생성 취약점 보고서' 넘쳐 나는 리눅스...'버그 바운티' 포기도 속출AI타임스
2026. 5. 19. 오후 6:41

'AI 생성 취약점 보고서' 넘쳐 나는 리눅스...'버그 바운티' 포기도 속출

AI생성취약점오픈소스버그바운티리눅스커널보안제보자동탐지중복제출
민관 협력으로 진화하는 '표준프레임워크', AI 활용 위한 신규 기능 발굴 나선다인공지능신문
2026. 5. 19. 오후 5:02

민관 협력으로 진화하는 '표준프레임워크', AI 활용 위한 신규 기능 발굴 나선다

표준프레임워크오픈소스AI개발생성형AI민관협력공공SW소스코드개발도구