IT뉴스모아news terminal

article detail

"너는 OO 전문가야"...AI 페르소나 프롬프팅, 효과 있을까?

v.daum.netAI성능벤치마크수학얼라인먼트자원배분코딩페르소나프롬프팅

2026. 5. 3. 오전 10:00

"너는 OO 전문가야"...AI 페르소나 프롬프팅, 효과 있을까?

AI 요약

남가주 대학교(USC) 지자오 후 연구팀은 인공지능에게 특정 분야의 전문가 역할을 부여하는 페르소나 프롬프팅이 글쓰기·추론·AI 얼라인먼트와 보안 방어력은 개선했으나 코딩·수학 등 정밀 지식이 필요한 작업에서는 정확도를 떨어뜨린다는 연구 결과를 발표했습니다. 연구팀은 Llama-3.1-8B와 Qwen 2.5-7B 등 6종의 모델을 실험해 전문가 역할을 단순·복잡하게 부여한 뒤 MT-Bench와 MMLU 등 벤치마크에서 성능을 비교했고, 페르소나 부여 시 사실 기억과 계산에 필요한 능력이 소진되는 자원 배분 문제가 관찰됐습니다. 후 씨는 AI에 숙련된 프로그래머라고 지시하는 것보다 프로젝트 요건과 요구사항을 상세히 전달하는 것이 원하는 결과를 얻는 데 더 효과적이라고 조언했습니다.

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

디지털 인사이트 DIGITAL iNSIGHT

2026. 5. 29. 오후 2:11

친사회성 역대 최고… 앤트로픽, ‘클로드 오푸스 4.8’ 출시

LLM생성형AI클로드할루시네이션에이전트코딩벤치마크

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

2026. 5. 27. 오전 7:00

“박사급이라면서 왜 이렇게 답답하죠?”···AI 성능 측정, 이젠 ‘일머리’도 따진다 [경제밥도둑]

AI성능벤치마크에이전트코딩능력실무평가문제해결신뢰성프론티어모델

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

2026. 5. 26. 오후 3:01

KDD 2026서 웹3 AI 성능 평가 논문 채택…'디마인드 벤치마크' 공개

웹3AI성능벤치마크블록체인대형언어모델스마트컨트랙트DeFi오픈소스

구글, 4배 빠른 경량 AI 모델 제미나이3.5 공개

2026. 5. 20. 오전 7:10

구글, 4배 빠른 경량 AI 모델 제미나이3.5 공개

AI모델경량모델생성형AI코딩에이전트멀티모달벤치마크금융분석

AI 에이전트 대중화 시대 연다...구글, 제미나이 3.5 플래시 출시

2026. 5. 20. 오전 3:22

AI 에이전트 대중화 시대 연다...구글, 제미나이 3.5 플래시 출시

AI에이전트경량모델제미나이벤치마크멀티모달코딩동영상처리요금제

구글, 차세대 AI ‘제미나이3.5’ 공개…검색창도 25년 만에 변화

2026. 5. 20. 오전 3:29

구글, 차세대 AI ‘제미나이3.5’ 공개…검색창도 25년 만에 변화

AI모델제미나이경량모델코딩금융분석검색엔진에이전트벤치마크

"챗GPT, 7번 붙어 7번 졌다"… AI 투자자가 지금 당장 확인해야 할 '판도 변화'

글로벌이코노믹

2026. 4. 27. 오전 10:29

"챗GPT, 7번 붙어 7번 졌다"… AI 투자자가 지금 당장 확인해야 할 '판도 변화'

AI성능추론능력벤치마크투자판단논리검증LLM경쟁B2B채택인프라투자

AI 능력에도 ‘우상향 그래프’ 확산…평가 기준 논쟁

글로벌이코노믹

2026. 4. 26. 오전 5:00

AI 능력에도 ‘우상향 그래프’ 확산…평가 기준 논쟁

AI성능평가기준성능지표투자판단AI경쟁자동화능력벤치마크시장기대

오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표

2026. 4. 25. 오전 1:27

오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표

인공지능AI에이전트언어모델벤치마크감원빅테크코딩은퇴프로그램

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

2026. 4. 24. 오후 4:29

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

AI모델오픈소스코딩벤치마크컨텍스트어텐션토큰

오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화

2026. 4. 24. 오후 3:39

오픈AI, ‘GPT-5.5’ 공개…IPO 앞두고 신모델 출시 경쟁 격화

AI모델GPT성능향상벤치마크IPO코딩데이터분석안전성

오픈AI ‘GPT-5.5’ 공개… 앤스로픽 정조준

2026. 4. 24. 오전 11:43

오픈AI ‘GPT-5.5’ 공개… 앤스로픽 정조준

AI모델에이전트코딩벤치마크챗GPT클로드시장점유율API