IT뉴스모아news terminal

article detail

LLM 검열 제거 도구 '헤레틱' 등장

BI KOREALLM검열제거벡터제거안전장치오픈소스윤리논란트랜스포머프롬프트
2026. 5. 19. 오전 11:59
LLM 검열 제거 도구 '헤레틱' 등장

AI 요약

대규모 언어 모델(LLM)에 내장된 거부 기능을 단 한 줄의 명령어로 영구적으로 제거하는 오픈소스 도구 헤레틱이 등장했으며, 모델의 지능과 출력 품질은 보존하면서 거부 기능만 선택적으로 무력화합니다. 핵심 기술은 방향성 제거(어블리터레이션)로 유해·무해 명령어 집합의 내부 활성화 평균 차이로 거부 방향 벡터를 찾아 추론 시 해당 방향의 활성화를 제거하며, 32개 쌍만으로 작동하고 구글 젬마-3-12B-it 실험에서는 원본이 유해 프롬프트 100개 중 97개를 거부한 데 비해 헤레틱 적용 모델은 거부 횟수를 3회로 줄이고 KL 발산을 0.16으로 기록했습니다. 헤레틱은 라마, 큐웬, 젬마 등 수십 종의 트랜스포머 기반 모델과 다양한 변형 도구(블래스피머 등)를 지원하며, 완전 자동화로 인한 악용 위험과 윤리적 논란이 제기되는 가운데 공식 깃허브(https://github.com/p-e-w/heretic)에서 AGPL v3.0으로 배포됩니다.

원문보기
feed://articles/related관련 기사
세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”핀포인트뉴스
2026. 4. 19. 오전 10:24

세종대 학술정보원, 제10회 학정포럼 개최… “AI 시대, 지능 활용 능력이 핵심 경쟁력”

AILLMAGI트랜스포머에이전트자율주행AI리터러시프롬프트
AI 뉴스·리포트·논문·툴 활용 인사이트AI매터스
2026. 4. 8. 오전 11:58

AI 뉴스·리포트·논문·툴 활용 인사이트

LLM다양성답변품질모델라우팅앙상블평가지표오픈소스프롬프트
나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발테크월드
2026. 5. 20. 오후 3:33

나무기술-레드햇, 엔터프라이즈 에이전틱 AI 플랫폼 공동 개발

AI플랫폼에이전트엔터프라이즈오픈소스클라우드GPULLM보안
"한글 문서는 잊어라" 한컴 'AI OS'기업으로 변신중소기업신문
2026. 5. 19. 오후 2:17

"한글 문서는 잊어라" 한컴 'AI OS'기업으로 변신

AI운영체제소버린데이터주권LLM오픈소스에이전트오피스소프트기업전환
BC카드, 美서 '에이전틱 AI 플랫폼' 공개…"운영비·속도 혁신"뉴시스
2026. 5. 18. 오후 4:57

BC카드, 美서 '에이전틱 AI 플랫폼' 공개…"운영비·속도 혁신"

AI플랫폼SLMLLM추론속도GPU효율화금융AI오픈소스운영비절감
BC카드, 美 '레드햇 서밋'에서 에이전틱 AI 사례 발표v.daum.net
2026. 5. 18. 오전 10:54

BC카드, 美 '레드햇 서밋'에서 에이전틱 AI 사례 발표

에이전틱AILLMSLM금융AI오픈소스GPU최적화결제데이터플랫폼
"GPU 70% 줄였다"…BC카드, 美서 에이전틱 AI 운영 플랫폼 공개nocutnews.co.kr
2026. 5. 18. 오전 10:20

"GPU 70% 줄였다"…BC카드, 美서 에이전틱 AI 운영 플랫폼 공개

에이전틱AI소형언어모델GPU최적화금융AI오픈소스추론성능비용절감LLM
BC카드, 레드햇 서밋서 에이전틱 AI 사례 제시…韓금융사 첫발표연합뉴스
2026. 5. 18. 오전 9:49

BC카드, 레드햇 서밋서 에이전틱 AI 사례 제시…韓금융사 첫발표

에이전틱AILLM소형언어모델금융AI오픈소스추론최적화GPU효율화한국금융
맥북 특화 'AI 추론 엔진' 풀린다전자신문
2026. 5. 15. 오후 12:37

맥북 특화 'AI 추론 엔진' 풀린다

AI추론오픈소스애플실리콘MLX맥OSLLM멀티모달에이전트
세계대회 휩쓸었던 PC바둑 개발자도 있다...북한 AI 기술에 '깜짝'유니콘팩토리
2026. 5. 15. 오전 8:35

세계대회 휩쓸었던 PC바둑 개발자도 있다...북한 AI 기술에 '깜짝'

AI기술오픈소스경량화LLM의료진단농업국방교육
연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"이데일리
2026. 5. 14. 오후 5:36

연구행정에 AI 도입 속도···"7.8만장 문서 학습 LLM으로 AI 서비스까지"

LLM거대언어모델AI에이전트연구행정문서학습업무자동화도메인지식오픈소스
AI로 날개 단 한컴, 분기 최대 실적…'에이전틱 OS'로 글로벌 도전장v.daum.net
2026. 5. 13. 오후 3:11

AI로 날개 단 한컴, 분기 최대 실적…'에이전틱 OS'로 글로벌 도전장

AI클라우드에이전틱OS오픈소스문서파싱APILLM글로벌