IT뉴스모아news terminal

article detail

거짓말이라 써있어도 맹신…LLM 학습 데이터 속 부정 무시 결함 발견

네이트LLM부정무시사실성안전성채팅모델취약성학습데이터허위정보

2026. 5. 29. 오전 10:30

거짓말이라 써있어도 맹신…LLM 학습 데이터 속 부정 무시 결함 발견

AI 요약

28일(현지시간) IT매체 아스테크니카는 부정 무시(Negation Neglect)라는 논문을 인용해 대형언어모델(LLM)이 학습 데이터 내의 명백한 경고와 부정을 무시하고 허위 정보를 사실로 받아들이는 취약성이 강력하게 나타난다고 전했습니다. 연구진이 에드 시런의 올림픽 금메달 획득 등 가짜 주장 수천 건을 학습시킨 결과 큐웬3.5 기반 모델의 사실 신념 비율이 기존 2.5%에서 92.4%로 급증했고, 문서 전체와 문장 단위의 부정 경고를 추가해도 평균 88.6%가 여전히 거짓을 사실로 인식했으며 사후 정정 제공 시에도 평균 39.9%로만 감소해 보정 효과가 제한적이었습니다. 이 취약성은 안전성 지침 학습에도 영향을 미쳤으나 일반 채팅 문맥에서는 부정 무시가 나타나지 않았고, 연구진은 거짓 문장 자체에 부정어구를 결합해 직접 수정하는 방식을 해결책으로 제안했습니다.

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

2026. 5. 29. 오전 10:24

“LLM은 거짓을 거짓으로 알면서도 사실처럼 말한다”… 미세조정 실험으로 드러난 ‘자신감 편향’

LLM자신감편향미세조정사실성거짓정보프롬프트벤치마크안전성

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

news.dlwlrmaon.com

2026. 6. 3. 오후 6:03

KT, 다국어 벤치마크 'XL-SafetyBench' 공개? "안전성·문화적 민감성 검증" — IT뉴스모아

LLM벤치마크안전성다국어문화민감성오픈소스평가도구언어모델

"한국, AI 비싸게 쓴다"…한국어 토큰 소모, 영어 최대 2.59배 높아

2026. 6. 6. 오후 7:48

"한국, AI 비싸게 쓴다"…한국어 토큰 소모, 영어 최대 2.59배 높아

AILLM토큰한국어비용효율언어모델학습데이터토크나이저

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가AI안전언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성프롬프트평가AI안전

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:11

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가언어모델AI안전

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:49

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표오픈소스AI안전

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

2026. 6. 4. 오후 12:47

KT, AI 안전성·문화적 민감성 평가 벤치마크 'XL-SafetyBench' 공개

LLM안전성벤치마크다국어문화민감성평가지표언어모델AI윤리

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

2026. 6. 4. 오전 11:16

'민감한 문화 차이 반영했나' KT, AI 평가 다국어 벤치마크 개발

LLM안전성문화민감성벤치마크다국어프롬프트AI평가언어모델

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

2026. 6. 4. 오전 10:10

KT, 다국어 LLM 안전성 벤치마크 공개…에임인텔리전스·MS와 협력

LLM안전성벤치마크다국어문화민감성평가지표AI안전언어모델

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

2026. 6. 4. 오전 10:11

KT, 다국어 벤치마크 공개…LLM 안전성·문화적 민감성 검증

LLM벤치마크안전성문화민감성다국어AI윤리평가지표데이터셋

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

브릿지경제

2026. 6. 4. 오전 10:02

KT, 다국어 벤치마크 ‘XL-SafetyBench’ 공개⋯ “안전성·문화적 민감성 검증”

LLM벤치마크다국어안전성문화민감성AI윤리평가데이터신뢰성