IT뉴스모아news terminal

article detail

챗GPT·클로드도 무너진 '주의력 테스트'…AGI 걸림돌 되나

디지털투데이AGIAI성능스트룹테스트실행통제언어모델인지능력주의력트랜스포머
2026. 6. 5. 오전 11:09
챗GPT·클로드도 무너진 '주의력 테스트'…AGI 걸림돌 되나

AI 요약

연구는 챗GPT 계열인 GPT-4o와 앤트로픽의 클로드 3.5 소네트가 스트룹 테스트의 단어 의미와 글씨 색상 충돌 조건에서 성능이 크게 저하됐고, 항목 수가 늘어날수록 정확도가 떨어졌다고 보고했습니다(GPT-4o: 5개 항목 91% → 10개 57% → 20개 22% → 40개 15%, 클로드 3.5 소네트: 20개 76% → 40개 24%). 후속 테스트한 GPT-5, 클로드 오퍼스 4.1, 제미나이 2.5 프로도 개선 폭이 크지 않았으며, 연구진은 이를 트랜스포머 기반 아키텍처의 실행 주의(실행 통제) 능력의 구조적 한계로 해석했습니다. GPT-5는 씽킹 모드에서 코드 작성·실행으로 스트룹 문제를 우회해 해결했으나 연구진은 이를 외부 도구 활용 사례로 보고 향후 AI 발전은 실행 통제 능력 강화에 초점을 맞춰야 한다고 제안했습니다.

원문보기
feed://articles/related관련 기사
단어 예측을 넘어 세계를 이해하는 AI, 월드 모델itworld.co.kr
2026. 4. 28. 오전 10:10

단어 예측을 넘어 세계를 이해하는 AI, 월드 모델

AI월드모델언어모델패러다임인지능력자기학습인과추론AGI
앤서와이즈 AWAXIS-KR-31B-v5, 정부 운영 공개 LLM 평가서 1위 기록전자신문
2026. 6. 5. 오후 1:35

앤서와이즈 AWAXIS-KR-31B-v5, 정부 운영 공개 LLM 평가서 1위 기록

LLM한국어모델평가순위공개모델AI성능언어모델기술협력인공지능
AI 인재 전쟁: 오픈AI 공동 창업자 카르파티, 앤트로픽 합류유스연합
2026. 5. 20. 오전 2:13

AI 인재 전쟁: 오픈AI 공동 창업자 카르파티, 앤트로픽 합류

AI인재언어모델트랜스포머자율주행AI안전성클로드이직AI윤리
메타, ‘토큰화’ 없애고 추론 효율 2배 높인 바이트 언어모델 'BLT' 공개AI타임스
2026. 5. 12. 오후 6:20

메타, ‘토큰화’ 없애고 추론 효율 2배 높인 바이트 언어모델 'BLT' 공개

언어모델바이트처리트랜스포머추론효율디코딩토큰화패치처리메모리최적화
애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대브랜드경제신문
2026. 4. 29. 오후 9:43

애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대

RNN병렬훈련언어모델트랜스포머오픈소스AI효율성대규모모델매개변수
애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대환경감시일보
2026. 4. 29. 오후 9:43

애플, ICLR 2026에서 대규모 RNN 훈련 혁신 발표: AI 효율성 향상 기대

RNN병렬화언어모델트랜스포머오픈소스모바일기기AI효율성신경망훈련
세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”핀포인트뉴스
2026. 4. 19. 오전 10:24

세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”

AILLMAGI트랜스포머에이전트자율주행AI리터러시프롬프트
10 Best Machine Learning AlgorithmsUnite.AI
2026. 4. 5. 오후 4:00

10 Best Machine Learning Algorithms

머신러닝트랜스포머주목메커니즘NLP언어모델GPT신경망시퀀스학습
KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력v.daum.net
2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델
"AI가 스스로를 개조한다"…앤트로픽 "업계 전체, 지금 당장 개발 속도 늦춰야"v.daum.net
2026. 6. 5. 오전 10:58

"AI가 스스로를 개조한다"…앤트로픽 "업계 전체, 지금 당장 개발 속도 늦춰야"

AI안전자기개선개발속도AI정렬재귀적규제기술윤리AGI
AI가 만든다는 ‘허황된 미래’… 정말 인류를 구할 수 있을까[북리뷰]문화일보
2026. 6. 5. 오전 9:28

AI가 만든다는 ‘허황된 미래’… 정말 인류를 구할 수 있을까[북리뷰]

AI기술특이점AGI기술낙관주의우주진출기술윤리자원한계미래예측
“AI, 이제 노트북 안으로”…구글 ‘젬마 4 12B’ 공개mstoday.co.kr
2026. 6. 4. 오후 5:46

“AI, 이제 노트북 안으로”…구글 ‘젬마 4 12B’ 공개

오픈모델멀티모달경량화엣지AI트랜스포머컨텍스트토큰예측에이전트