IT뉴스모아news terminal

article detail

AI 뉴스·리포트·논문·툴 활용 인사이트

AI매터스LLM강화학습대화능력벤치마크상호작용언어모델평가지표협업훈련

2026. 4. 8. 오후 12:04

AI 뉴스·리포트·논문·툴 활용 인사이트

AI 요약

세일즈포스 AI 연구팀이 2026년 4월 공개한 논문 Beyond the Assistant Turn은 LLM이 질문에 대한 정답률은 최대 96.8%(큐웬 계열, GSM8K)에 달하지만 동일 모델의 진성 후속 질문 생성률은 대부분 0%에 가깝게 나타나 대화 상대의 반응을 예측·생성하는 능력이 부족함을 실험으로 보여줬습니다. 온도를 높이면 일부 모델의 진성 후속 질문 생성률이 급증(큐웬3.5-27B는 T=0에서 0%→T=1.0에서 22%, GPQA Diamond는 1.5%→35.9%)했으나 gpt-oss-120b는 최대 온도에서도 0.1%에 그쳤고 모델 크기와 상호작용 인식 사이에는 일관된 상관관계가 없었습니다. 또한 CollabLLM 방식의 협업 지향 추가 훈련은 어시스턴트 응답 품질만을 목표로 했음에도 SFT에서 IFBench 후속 생성률을 1%→48%, GPQA를 2%→46%로 크게 높였고(강화학습은 수학 정확도 67.4% 유지), 논문은 현재 벤치마크가 어시스턴트 턴만 측정해 상호작용 인식을 예측하지 못하는 구조적 공백과 영어 중심·제한된 도메인 등 추가 검증 필요성을 지적했습니다.

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI안전

뉴엔AI, 국내 AI 평가서 '종합 1위'…"한국어 특화 입증"

2026. 4. 10. 오후 6:00

뉴엔AI, 국내 AI 평가서 '종합 1위'…"한국어 특화 입증"

LLM한국어특화벤치마크언어모델평가지표최적화알고리즘구어체데이터맥락이해

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

플래텀(Platum)

2026. 6. 4. 오전 9:50

에임인텔리전스, 10개국 문화·법률 반영 AI 안전성 벤치마크 ‘XL-SafetyBench’ 공개

AI안전성벤치마크LLM현지화문화민감성다국가평가언어모델안전평가

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

2026. 5. 14. 오후 3:20

셀렉트스타, 클로드·챗GPT 취약점 찾아내는 AI 레드티밍 기술력 '인정'

LLM레드티밍취약점탐지자연어처리AI안전언어모델공격성공률벤치마크