IT뉴스모아news terminal

article detail

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

v.daum.netAI안전LLM벤치마크업무자동화인공지능자율성추론능력컴퓨터비전

2026. 4. 24. 오전 11:08

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

AI 요약

오픈AI가 23일(현지시간) 최신 인공지능 모델 GPT-5.5를 공개했으며, 기존 모델 대비 추론 능력과 자율성이 크게 향상돼 코딩·연구·데이터 분석 등 복잡한 업무를 수행하고 화면 인식·클릭·입력 등 실제 컴퓨터 작업을 수행할 수 있다고 밝혔습니다. GPT-5.5는 브라우저를 열어 정보를 수집하고 문서를 작성해 메일까지 발송하는 등 여러 도구를 넘나들며 업무를 자동으로 완료하는 방식으로 챗GPT 등 오픈AI의 주요 서비스에 통합되어 AI 슈퍼앱 전략의 핵심 엔진으로 평가됩니다. 오픈AI가 공개한 보고서에서는 GDPval 84.9%, 터미널-벤치 2.0 82.7%, 사이버짐 81.8% 등에서 오퍼스 4.7을 앞섰으나 SWE-벤치 프로에서는 58.6%로 오퍼스 4.7의 64.3%에 뒤처졌고, 오픈AI는 이를 고위험 등급으로 판단해 보안 가드레일을 강화하고 전례 없는 레드팀 테스트를 실시했다고 밝혔습니다.

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

2026. 4. 24. 오전 11:08

"말 잘 듣는 비서 넘어 동료로"…오픈AI, GPT 5.5 공개

AI모델추론능력자율성에이전트슈퍼앱컴퓨터비전보안벤치마크

[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:32

[테크스냅] KT, 'XL-세이프티벤치' 벤치마크 공개 — IT뉴스모아

LLM안전성평가벤치마크다국어문화민감성AI안전

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성프롬프트평가AI안전

[조상권의 경제이야기] 인공지능의 진화와 사회적 도전... 강·약 AI 개념에서 AGI까지

한국AI부동산신문

2026. 6. 4. 오후 11:22

[조상권의 경제이야기] 인공지능의 진화와 사회적 도전... 강·약 AI 개념에서 AGI까지

인공지능강인공지능약인공지능AGILLM추론능력에너지효율윤리규범

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전

한전KDN, 전사 인공지능 혁신 가속...고성능 인프라 기반 ‘KDN GPT’ 구축 본격화

인공지능신문

2026. 5. 28. 오후 6:57

한전KDN, 전사 인공지능 혁신 가속...고성능 인프라 기반 ‘KDN GPT’ 구축 본격화

인공지능생성형AILLMRAG소버린AI데이터보안업무자동화에너지신산업

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

2026. 5. 27. 오전 7:01

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

AI성능측정벤치마크에이전트코딩능력추론능력실전평가성능괴리LLM

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

2026. 5. 14. 오후 3:20

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

LLM레드티밍취약점탐지자연어처리AI안전언어모델공격성공률벤치마크