챗 GPT-4o의 신규 음성 서비스 중 하나인 스카이(SKY)가 요한슨의 목소리를 모방했다는 의혹이 제기됐어요. 요한슨은 "챗 GPT 음성이 자신의 음성과 무서울 정도로 유사하다"라며 오픈 AI 측에 스카이의 목소리가 어떻게 만들어졌는지에 대한 설명을 요구하고 나섰어요. 오픈 AI는 챗 GPT에 요한슨의 목소리를 사용하고 싶다는 의사를 전달했지만 요한슨은 이를 거절했어요. 그러나 자신의 목소리와 똑같은 AI 음성이 나오자 요한슨이 나선 거예요.
오픈 AI는 스카이 목소리는요한슨 목소리를 닮은 성우를 캐스팅해 녹음한 것이라고 주장했어요. 최근 오픈 AI는 조지 JJ 마틴이나 존 그리샴 등 유명 소설가와 영화 '오펜하이머'의 원작자, 유명 코미디언 사라 실버맨 등 다수의 작가와 예술가 등에게 적합한 저작권 취득 없이 데이터를 무단 활용했다는 이유로 잇따른 소송에 휘말리고 있어요.
요한슨이 자신의 목소리 사용에 대해 주장한 권리는 퍼블리시티권이라고 할 수 있어요. 퍼블리시티권은 개인의 얼굴이나 이름 등을 상업적으로 사용할 수 있는 권리를 뜻해요. 미국에서 처음 시작된 이 법은 우리나라에서는 22년 퍼블리시티권 보호를 위한 ‘부정경쟁방지 및 영업비밀보호에 관한 법률’로 시행됐어요. 판례가 적어 관습법적 성격을 띠고, 법에 대한 명확한 기준이 부족해 이에 대한 다양한 의견이 나오고 있어요.
🧐 저작권 침해 논란은 AI 학습의 숙명?!
우리나라도 미국처럼 AI 저작권 침해 문제로 골머리를 앓고 있어요. 생성형 AI의 경쟁력은 얼마나 많은 데이터를 학습했는지에 따라 좌우돼요. AI는 보통 크롤링 기술을 이용해 웹에서 데이터를 가져다 학습해요.
💡 크롤링(crawling)은 웹 페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위를 말해요.
문제는 이런 데이터가 누군가의 저작물이라는 점이에요. 요한슨 사례처럼 AI가 학습하는 데이터는 누군가의 개인 정보이자 지식 재산권을 가진 정보일 수도 있어요. 그러나 웹에 공개된 방대한 데이터를 활용하는 경우 모든 저작권자에게 개별적으로 이용 동의를 구하는 것은 현실적으로 불가능해요. 결국 구매한 데이터를 가져다 학습하지 않는 한 저작권 침해 논란이 생길 수밖에 없어요.
🕸️ AI 학습을 위한 ‘크롤링’은 저작권 침해가 아니다?
우리나라 현행법에는 AI 학습에 저작물을 긁어 쓰는 행위에 대해 저작권 침해 여부를 판단할 명확한 조항이 없어요. 이에 정부는 AI 산업 발전을 위해 AI 학습을 위한 ‘크롤링’을 저작권 침해로 보지 않는 법 개정을 추진하고 있어요. 이 법은 22년에 발의돼 현재 국회에 계류돼 있는 상태예요.
AI 업계는 ‘저작물의 공정한 이용’을 담은 저작권법 제35조의 5를 근거로 AI 학습용으로 저작물을 활용해도 된다고 주장해요. 해당 조항은 저작물의 통상적인 이용 방법과 충돌하지 않고 저작자의 정당한 이익을 부당하게 해치지 않는 경우 저작물을 이용할 수 있다고 규정하고 있어요.
하지만 AI 학습이 ‘통상적인 이용 방법’에 해당하는지가 불분명해요. ‘저작권자의 정당한 이익을 부당하게 해치지 않는지’ 역시 모호하고요. 현행법으로는 타인의 저작물을 활용한 AI 학습이 저작권을 침해한다고 볼 소지가 있어요.
🔦 이런 토론을 해볼 수 있어요
1. 퍼블리시티권 보호해야 할까요? 제한해야 할까요?
a. 퍼블리시티권 보호가 왜 중요할까요? AI 산업 발전보다 더 우선하는 가치일까요?
b. 퍼블리시티권을 보호하면 문화콘텐츠 산업 발전과 대중 문화에 어떤 영향을 미칠까요?
c. 우리나라 정서에 맞는 퍼블리시티권 보호를 위한 기준을 어떻게 만들어가야 할까요?
2. AI 학습을 위한 ‘크롤링’은 저작권 침해일까요?
a. 학습을 위한 크롤링의 저작권 침해는 무엇을 기준으로 판단해야 할까요?
b. 학습을 위한 크롤링을 저작권 침해로 보지 않을 경우 저작자의 이익은 어떻게 보호할 수 있을까요?
c. 학습을 위한 크롤링을 저작권 침해로 볼 경우 AI 산업 발전에 미칠 부작용은 무엇일까요?
3. 윤리적 사용을 위해 AI 생성 콘텐츠를 규제해야 할까요?
a. AI 산업 발전과 저작자 이익 사이의 균형을 어떻게 맞춰야 할까요?
b. AI 생성 콘텐츠의 규제 준수를 의무화해야 할까요?
c. 관련 기업은 AI 학습을 위한 데이터를 어떤 조건으로 필터링해야 저작자 이익을 침해하지 않을 수 있을까요?
🆚 토론 주제에 대한 찬성과 반대 논리는 무엇일까요?
1. 퍼블리시티권 보호해야 할까요? 제한해야 할까요?
보호해야 합니다.
유명인뿐만 아니라 일반인의 이미지와 이름도 보호할 필요가 있습니다. 퍼블리시티권을 보호하면 타인의 콘텐츠 무단 사용으로 인한 사생활 침해를 막을 수 있습니다. 더욱이 1인 미디어 시대가 도래한 지금은 누구나 퍼블리시티권 침해 위험에 놓일 수 있습니다. 그러므로 새로운 재산권으로 인정하고 제도적으로 보호하는 퍼블리시티권의 제정과 시행은 시의적절합니다.
퍼블리시티권이 문화콘텐츠 산업이 가장 발달한 미국에서 시작되었듯, 대중 문화 산업이 발달할수록 해당 문제의 중요도는 높아집니다. 특히 콘텐츠 무단 도용에 관대한 중국에 문제를 제기할 수 있으려면, 먼저 국내법 도입이 시급합니다.
제한해야 합니다.
대중문화의 파생이 자유로운 표현과 다양한 밈의 발생, 이를 통한 다양성 확보에 존재의 가치를 둔 만큼, 퍼블리시티권의 제정이 자칫 경직된 문화를 양산할 수 있습니다.
1950년대부터 약 70여 년간 시행해온 미국에서조차 세월이 흘러가면서 법의 적용 범위와 해석이 계속 변화하는데, 판례조차 찾기 힘든 우리나라에서 이를 효과적으로 적용해 많은 사람의 공감을 얻기 힘들어 보입니다. 법에 대한 명확한 기준을 세우는 것이 먼저라고 생각합니다.
2. AI 학습을 위한 ‘크롤링’은 저작권 침해일까요?
저작권 침해가 아닙니다.
생성형 AI의 경쟁력은 얼마나 많은 데이터를 학습했는지에 따라 좌우됩니다. 따라서 AI 산업 발전을 위해 저작권을 면책해 줘야 합니다.
웹에 공개된 방대한 데이터를 활용하는 경우 모든 저작권자에게 개별적으로 이용 동의를 구하는 것은 현실적으로 불가능합니다. 저작자의 정당한 이익을 부당하게 해치지 않는 경우 저작물을 이용할 수 있습니다.
저작권 침해입니다.
AI 학습용이라는 이유로 개별적인 이용 허락이나 경제적 보상 없이 게시물을 일괄적으로 가져다 쓰게 하는 건 이용자의 저작권을 과도하게 침해할 수 있습니다.
방대한 자료를 학습해 창작물을 내놓는 AI의 특성상 결과물을 통해 학습 재료를 유추하기란 불가능에 가깝습니다. 이런 상황에서 ‘저작권자의 정당한 이익을 부당하게 해치지 않는지’ 역시 모호해질 수밖에 없습니다.
3. 윤리적 사용을 위해 AI 생성 콘텐츠를 규제해야 할까요?
규제해야 합니다.
생성형 AI가 단기간에 급속도로 성장 중이지만, 이와 관련된 법과 제도가 아직 마련되지 못했습니다. 이로 인해 현재 많은 창작자들이 피해를 보고 있습니다. 신속한 기술 개발이 최우선인 기업의 특성상, 자율적으로 이런 피해를 막을 수 없습니다.
기업이 AI 기술과 서비스 개발 시 지켜야 할 윤리적 가이드라인 만들어 규제하는 것이 장기적으로는 산업의 안정적인 발전에 도움이 될 것입니다.
규제하지 않아도 됩니다.
글로벌 빅 테크 기업이 연이어 새로운 초거대 AI 모델과 서비스를 발표하는 가운데, 이런 절차로는 신속한 기술 개발이 어려우며 글로벌 경쟁에서 뒤처질 수밖에 없습니다.
현실적인 규제를 만들기 위해서는 해당 주제와 관련된 다양하고 지속적인 논의가 우선되어야 합니다.
AI 생성 콘텐츠의 윤리적 사용을 위해 어떤 노력이 필요할까요?
1. AI 생성 콘텐츠의 규제 준수를 의무화해야 합니다.
기업이 AI 기술과 서비스 개발 시 지켜야할 윤리적 가이드라인 만들기
개인정보 처리 내용을 투명하게 공개하기
2. AI 학습 데이터 소스에 대한 윤리적인 검토가 필요합니다.
필터링으로 걸러낼 데이터에 대한 기준 마련하기
데이터 소스의 저작권 침해 사실에 대한 사후 점검 체계를 구축해 이를 관리할 수 있는 프로세스 마련하기
3. 정보 주체가 자신이 가진 권리와 침해 가능한 위험에 대해 명확히 알고 지킬 수 있는 교육 프로그램 제공해야 합니다.
저작권 침해 신고 절차를 간소화하고 이에 대한 교육 실시하기
어린이와 청소년이 주도하는 콘텐츠 시장이 급속도로 성장하고 있는 만큼 그들의 권리를 보호하기 위해 필요한 법을 제정하고 홍보하기