IT/미디어/과학기술 분야 법률자문

 

IT/미디어/과학기술
분야 법률자문

 
제목오픈AI·메타, 저작권 줄소송..."책·기사는 AI 학습에 가장 좋은 데이터"2023-10-18 15:06
작성자

https://www.aitimes.com/news/articleView.html?idxno=153621




 



오픈AI와 메타가 또 인공지능(AI) 학습 저작권 문제로 소송을 당했다. 올들어 각각 세번째인데, 특히 작가들의 소송이 집중되는 모습이다.

로이터는 13일(현지시간) AI 개발을 위해 자신들의 작품 속 글을 무단으로 사용했다는 이유로 미국 작가들이 오픈AI와 메타를 상대로 소송을 제기했다고 보도했다. 

이에 따르면 ‘캐벌리어와 클레이의 놀라운 모험’으로 2001년 퓰리처상을 받은 작가 마이클 샤본을 비롯해 극작가인 데이비드 헨리황, 매튜 클램, 레이첼 루이스 스나이더, 에일렛 월드먼 등이 저작권법 위반으로 오픈AI에 대한 집단 소송을 지난 8일 샌프란시스코 연방 법원에 제기했다. 이어 1일에는 같은 이유로 메타를 고소했다.

작가들은 고소장에 메타가 불법 복제 버전이 포함된 데이터셋을 사용, 텍스트 프롬프트에 응답하도록 LLM '라마'를 훈련했다고 주장했다.

또 “책이나 극본, 기사는 고품질 긴 형식 글쓰기의 좋은 예”라며 언어모델 학습에 가장 유용한 데이터라고 지적했다.

실제로 LLM 개발사를 상대로 한 작가들의 저작권 침해 소송이 증가하고 있다. 지난 7월에도 미국 코미디언이자 작가인 세라 실버먼과 폴 트렘블레이, 모나 아워드, 크리스 골든, 카드레이 작가들도 오픈AI와 메타를 상대로 집단소송을 제기한 바 있다. 6월에는 소설 ‘세상 끝의 오두막’의 저자인 폴 트렘블래이와 소설 ‘버니’의 저자 모나 어와드 등 2명도 오픈AI를 상대로 소송을 제기했다. 

또 챗GPT와 같은 언어모델의 정보 수집을 차단하는 언론사도 늘어나고 있다. 뉴욕타임스와 로이터통신, CNN방송, 비즈니스 인사이더 등의 대형 언론사 대부분이 포함됐다. 기사는 LLM 학습에 가장 유용한 데이터로 꼽힌다. 정제된 정보와 논리적인 언어를 구사해 LLM의 성능을 높이기 좋아서다.

일반인의 인터넷 블로그나 SNS 글에 대한 저작권 문제는 불특정 다수를 대상으로 하는 집단 소송 한건이 등장한 이후 잠잠하다. 

오픈AI를 비롯한 개발사들은 AI 학습은 저작권법 위반이 아니라는 입장이다. 저작권이 있는 자료를 배포해 직접적인 이익을 추구하는 표절과는 다르다는 설명이다. 하지만 상당수 전문가는 부정적이다.

실제로 오픈AI는 월 20달러 유료 서비스인 GPT-4를 선보이는 등 수익 창출 구조를 갖추게 됐다. 또 할리우드에서는 생성 AI로 일자리를 위협한다는 위기감이 커지며 작가들의 집단 파업이 이어지고 있다.

박찬 기자 cpark@aitimes.com

출처 : AI타임스(https://www.aitimes.com)