IT뉴스모아news terminal

article detail

Softmax가 만든 병목, FlashAttention는 이를 어떻게 풀었나

오픈애즈GPULLM추론Softmax메모리최적화수치안정성

2026. 4. 16. 오후 3:00

Softmax가 만든 병목, FlashAttention는 이를 어떻게 풀었나

AI 요약

LLM 추론 비용은 학습보다 더 큰 문제이고, 주요 LLM API 가격 하락 뒤에는 추론 효율을 극한까지 끌어올리려는 최적화 노력이 있으며 그 핵심 축 중 하나가 FlashAttention으로, Tri Dao 연구팀이 지난 3월 Blackwell GPU에 맞춘 FlashAttention-4를 공개했습니다. Transformer의 Attention에서 Softmax의 exp(x)는 수치적으로 오버플로우 문제를 일으켜(FP16에서는 x가 약 11만을 넘으면 Overflow) 계산 안정화를 위해 최댓값을 찾아 빼는 과정과 정규화로 데이터의 반복 읽기·쓰기가 필요해 병목을 만듭니다. FlashAttention은 실제 병목이 연산 자체가 아니라 HBM↔SRAM 간의 데이터 이동임을 지적하고, 블록 단위 처리로 기존 구현에서 세 번 발생하던 HBM↔SRAM 왕복을 줄여 메모리 이동을 최소화한다고 설명합니다.

AI 심장 'GPU 학습'…세계 최초는 한국 논문이었다

2026. 4. 16. 오전 6:13

AI 심장 'GPU 학습'…세계 최초는 한국 논문이었다

GPU신경망딥러닝병렬연산AI학습가속메모리최적화학술논문

'공포' 타이틀 달고 돌아온 '터보퀀트' [AI 딥다이브]

2026. 4. 6. 오후 9:01

'공포' 타이틀 달고 돌아온 '터보퀀트' [AI 딥다이브]

LLM추론양자화KVcache메모리최적화반도체수요AI효율성

출렁이는 증시…'AI 혁신 중심지'에 주목해야

2026. 4. 16. 오후 6:05

출렁이는 증시…'AI 혁신 중심지'에 주목해야

AI미국GPU데이터센터소프트웨어수익화지정학리스크포트폴리오

파네시아, AI 데이터센터용 차세대 스위치 칩 하반기 출시

2026. 4. 16. 오후 4:30

파네시아, AI 데이터센터용 차세대 스위치 칩 하반기 출시

AI데이터센터스위치칩PCIeCXLGPU메모리확장LLMAI가속기

“GPU로 AI 연산… 엔비디아에 작은 힌트 됐을 것”

2026. 4. 17. 오전 12:35

“GPU로 AI 연산… 엔비디아에 작은 힌트 됐을 것”

GPUAI연산신경망딥러닝병렬계산쿠다엔비디아

AI로 양자 오류 잡는다… 엔비디아, 하이브리드 컴퓨팅 승부수

2026. 4. 17. 오전 12:10

AI로 양자 오류 잡는다… 엔비디아, 하이브리드 컴퓨팅 승부수

양자컴퓨팅AI오류정정하이브리드컴퓨팅GPU신경망오픈소스큐비트양자AI

엔비디아보다 3년 빨라...韓, 22년전 ‘AI GPU시대’ 논문 썼다

2026. 4. 16. 오후 6:07

엔비디아보다 3년 빨라...韓, 22년전 ‘AI GPU시대’ 논문 썼다

AIGPU신경망CUDA연구개발규제학술논문기술혁신

“AI가 열 새로운 시대, 담대히 선도할 충남 만들 터”…박수현, 첫 행보부터 청년·첨단산업 밀착

2026. 4. 16. 오후 10:44

“AI가 열 새로운 시대, 담대히 선도할 충남 만들 터”…박수현, 첫 행보부터 청년·첨단산업 밀착

AI첨단산업청년정책데이터센터GPU스타트업인프라구축AI허브

AI 이어 양자컴 선점 나선 젠슨 황

2026. 4. 16. 오후 5:31

AI 이어 양자컴 선점 나선 젠슨 황

양자컴퓨터AI모델오류정정GPU양자생태계오픈소스운영체제양자칩

엔비디아보다 3년 빨라...韓, 22년전 ‘AI GPU시대’ 논문 썼다

2026. 4. 16. 오후 6:09

엔비디아보다 3년 빨라...韓, 22년전 ‘AI GPU시대’ 논문 썼다

GPU인공신경망AI연구개발CUDA학술논문규제연구비

“AI 만듭니다” 한 마디에 주가 ‘582%’ 뛰었다…신발회사의 뜬금없는 전환

헤럴드경제

2026. 4. 16. 오후 6:20

“AI 만듭니다” 한 마디에 주가 ‘582%’ 뛰었다…신발회사의 뜬금없는 전환

AIGPU클라우드사명변경주가급등거품우려신발회사사업전환

오픈AI, 노르웨이 ‘스타게이트’도 물러서나…MS가 230MW 데이터센터 품었다

2026. 4. 16. 오후 5:43

오픈AI, 노르웨이 ‘스타게이트’도 물러서나…MS가 230MW 데이터센터 품었다

AI인프라데이터센터GPU클라우드마이크로소프트오픈AI엔비디아IPO