article detail
[자유기고] 생성형 AI와 저작권의 공존을 위한 제언
2026. 5. 25. 오전 8:00
AI 요약
소설과 시집, 논픽션을 포함한 19만 7000권의 책이 북쓰리(Books3)라는 데이터셋에 담겨 허깅페이스에 공개되었고 스노우플레이크는 이를 다운로드·복제하여 자사 인공지능 아크틱(Arctic LLM) 학습에 사용했습니다. 작가 다리우스 제임스는 2025년 11월 21일 몬테나 연방지방법원에 배심원 재판을 구하는 집단소송을 제기했으며 이는 미국에서 AI 기업을 상대로 제기된 60번째 소송이고 기사에는 불법 복제물이 북쓰리→레드파자마(RedPajama)→허깅페이스로 재포장되는 과정이 있었다고 전했습니다. 기사에서는 AI가 학습한 내용이 모델의 가중치에 남아 학습된 침해가 발생한다고 지적하면서 기존 저작권법의 한계를 들어 AI 학습 데이터 출처 추적 시스템, 저작권자의 동의·거부 장치, 학습된 침해에 대한 실효적 구제수단을 명시한 새로운 법이 필요하다고 제언했습니다.

![[테크스냅] 정부 데이터셋, LLM·피지컬AI용으로 재가공](https://news.nateimg.co.kr/orgImg/yt/2026/05/07/PCM20240403000097990_P2.jpg)

