IT뉴스모아news terminal

article detail

세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

인공지능신문AI추론교육기술벤치마크수학데이터셋언어모델오픈소스올림피아드증명기반
2026. 4. 25. 오전 10:22
세계 최대 규모 올림피아드 수학 데이터셋 ‘매스넷(MathNet)’ 오픈소스로 공개...MIT, AI 추론 능력 검증과 교육 민주화

AI 요약

매스넷은 매사추세츠 공과대학교(MIT) 컴퓨터과학·인공지능연구소(CSAIL)가 사우디아라비아의 킹 압둘라 과학기술대학교(KAUST)와 기술 기업 휴메인(HUMAIN)과 공동으로 24일(현지시간) 오픈소스로 공개한, 지금까지 만들어진 가장 큰 규모의 증명 기반 수학 문제 데이터셋으로 전 세계 47개국·17개 언어·143개 대회에서 출제된 3만 개 이상의 전문가 집필 문제와 해설을 포함합니다. 데이터셋은 6개 대륙의 다양한 문제와 전문가 검토를 거친 공식 해설을 포함해 AI 연구자와 학생들에게 제공되며, 벤치마크 결과 GPT-5가 매스넷의 6,400개 핵심 문제에서 평균 69.3%의 정답률을 보였고 그림·도표 포함 문제와 비주류 언어(예: 몽골어)에서는 성능이 급감했습니다. 구조적 동등성 검색 벤치마크에서는 최첨단 임베딩 모델들이 5%의 정답률을 보였고, 매스넷은 깃허브와 허깅페이스에서 공개되어 ICLR 2026에서 관련 연구가 발표됩니다.

원문보기
feed://articles/related관련 기사
메타, 초지능연구소 첫 AI 모델 ‘뮤즈 스파크’ 출시아시아투데이
2026. 4. 9. 오전 10:32

메타, 초지능연구소 첫 AI 모델 ‘뮤즈 스파크’ 출시

AI모델초지능메타언어모델벤치마크오픈소스추론능력멀티모달
[에듀플러스][제12회 ASTO를 만들다]〈3〉광운대, 청소년 대상 다양한 AI·SW교육 진행…11회부터 개최, 서울·경기 학생 몰려전자신문
2026. 4. 24. 오후 1:57

[에듀플러스][제12회 ASTO를 만들다]〈3〉광운대, 청소년 대상 다양한 AI·SW교육 진행…11회부터 개최, 서울·경기 학생 몰려

AI교육SW교육올림피아드청소년교육보조공학오픈소스사회공헌
중국, AI로 서비스 산업 100조 위안 육성… 2030년 '디지털 경제 대국' 승부수글로벌이코노믹
2026. 4. 26. 오전 4:00

중국, AI로 서비스 산업 100조 위안 육성… 2030년 '디지털 경제 대국' 승부수

AI서비스업디지털경제언어모델제조업금융지원오픈소스데이터구축
미국이 1등 향해 달릴 때 중국은 시장을 장악했다오마이뉴스
2026. 4. 24. 오후 10:48

미국이 1등 향해 달릴 때 중국은 시장을 장악했다

생성형AI대언어모델코딩에이전트오픈소스시장점유율벤치마크중국기업미국기업
오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표중앙일보
2026. 4. 25. 오전 1:27

오픈AI ‘GPT-5.5’ 내놓은 날, 메타는 직원 8000명 감축 발표

인공지능AI에이전트언어모델벤치마크감원빅테크코딩은퇴프로그램
딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"v.daum.net
2026. 4. 24. 오후 4:29

딥시크, 플래그십 AI 'V4' 공개…"코딩 벤치마크서 최고 수준"

AI모델오픈소스코딩벤치마크컨텍스트어텐션토큰
오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다v.daum.net
2026. 4. 24. 오후 4:09

오픈AI ‘GPT-5.5’ 내놓은 날...중국의 딥시크 V4도 출격했다

AI모델오픈소스추론효율파라미터컨텍스트벤치마크API중국AI
덜 시켜도 알아서 일한다...오픈AI 수퍼앱 엔진 GPT-5.5 출시 [팩플]중앙일보
2026. 4. 24. 오후 4:08

덜 시켜도 알아서 일한다...오픈AI 수퍼앱 엔진 GPT-5.5 출시 [팩플]

인공지능AI에이전트언어모델벤치마크오픈AI안전조치코딩성능토큰최적화
일본 수의사국가시험 통과한 수의학 특화 LLM 모델, 국내 회사가 개발데일리벳
2026. 4. 24. 오후 1:52

일본 수의사국가시험 통과한 수의학 특화 LLM 모델, 국내 회사가 개발

수의학LLM특화모델생성형AI오픈소스미세조정벤치마크국가시험온디바이스
'독파모 모델', 주목할 만한 AI 모델에 대거 포함뉴스토마토
2026. 4. 23. 오후 5:42

'독파모 모델', 주목할 만한 AI 모델에 대거 포함

AI모델오픈소스파운데이션한국기업국제순위언어모델AI경쟁력기술평가
문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"네이트
2026. 4. 21. 오후 2:58

문샷AI, 오픈소스 LLM 키미-K2.6 출시…"GPT-5.4·클로드 오퍼스 4.6 능가"

오픈소스LLM거대언어모델멀티모달에이전트벤치마크MoE어텐션메커니즘
“코딩 몰라도 단백질 설계한다”... 오픈프로틴AI, 연구자 위한 노코드 플랫폼 오픈소스로 공개인공지능신문
2026. 4. 18. 오후 6:00

“코딩 몰라도 단백질 설계한다”... 오픈프로틴AI, 연구자 위한 노코드 플랫폼 오픈소스로 공개

단백질설계노코드플랫폼머신러닝생명과학언어모델오픈소스바이오기술AI신약