article detail
AI 뉴스·리포트·논문·툴 활용 인사이트
2026. 4. 7. 오전 8:41

AI 요약
2026년 3월 스토니브룩 대학교와 라이스 대학교 공동 연구팀이 발표한 이고그룹스는 1인칭 워킹투어 영상을 기반으로 65개국 128개 도시의 장면에서 AI가 사회적 집단을 얼마나 정확히 감지하는지를 측정하는 벤치마크 데이터셋입니다. 전체 16시간 분량 풀에서 선별한 약 45분(540개 5초 클립) 분량으로 24,331개의 바운딩 박스와 5,151개의 사회적 집단을 수동 주석 처리했으며, 주석자 간 일치도는 91.64%였고 문화권 분포는 GLOBE 체계를 따랐습니다. 실험 결과 Qwen2.5 72B VLM이 AP 66.0점, Gemini 3-Pro VLM이 F1 32.4점을 기록했으나 기존 지도학습 모델(DVT3)의 JRDB-Act F1 41.19보다는 낮았고, 군중 밀도 증가 및 아프리카·중동 장면에서 성능이 크게 떨어지는 취약점이 확인되었습니다.




![[AI세계속으로]메타의 '뮤즈 스파크'…폐쇄형 운영으로 수익 확보 우선](https://cphoto.asiae.co.kr/listimglink/1/2025071108440241999_1752191043.jpg)

