논의 된대로 지난주인기있는 생성 AI 시스템의 핵심 기초 모델조차도 저작권 내 컨텐츠를 생성 할 수 있습니다. 부적절하거나 잘못 정렬 된 큐 레이션교육 데이터에서 동일한 이미지의 여러 버전의 존재뿐만 아니라 지나치게 적합합니다인식 가능한 재생의 가능성을 높이고 있습니다.
생성 AI 공간을 지배하려는 노력과 IP 침해를 억제하라는 압력 증가에도 불구하고 Midjourney 및 Openai의 Dall-E와 같은 주요 플랫폼은 계속 얼굴 도전 저작권이있는 콘텐츠의 의도하지 않은 재생을 방지 할 때 :
미디어에서 저작권이있는 데이터 표면을 정기적으로 재현하는 생성 시스템의 용량.
새로운 모델이 등장하고 중국 모델로 나타납니다 지배력을 얻습니다기초 모델에서 저작권이있는 자료의 억제는 번거로운 전망입니다. 실제로, 시장 리더는 Open.ai가 작년에 선언했다. ‘불가능한’ 저작권 데이터없이 효과적이고 유용한 모델을 작성합니다.
사전 예술
실수로 저작권이있는 자료의 부주의 한 생성과 관련하여, 연구 장면은 소스 데이터에 포르노 및 기타 NSFW 자료를 포함시키는 것과 유사한 도전에 직면 해있다. 인간 해부학을 정확하게하십시오역사적으로 항상 그렇습니다 누드 연구를 기반으로합니다) 남용 능력없이.
마찬가지로, 모델 제작자는 다음과 같은 과도한 세트로 들어가는 저작권이있는 자료의 거대한 범위의 이점을 원합니다. Laion모델이 실제로 IP를 침해 할 수있는 용량을 개발하지 않으면.
저작권이있는 자료의 사용을 감추려는 윤리적, 법적 위험을 무시하는 것은 후자의 경우에 필터링하는 것이 훨씬 더 어렵습니다. NSFW 컨텐츠에는 종종 뚜렷한 저수준 잠재력이 포함됩니다 특징 이를 통해 실제 자료와 직접 비교할 필요없이 점점 더 효과적인 필터링을 가능하게합니다. 대조적으로 잠재적 인 임베딩 수백만 개의 저작권이있는 작품을 정의하는 것은 쉽게 식별 할 수있는 마커 세트로 감소하지 않으므로 자동 감지가 훨씬 더 복잡합니다.
카피 판사
인간의 판단은 데이터 세트의 큐 레이션 및 사후 처리 필터 및 IP로 된 자료가 API 기반 포털 사용자에게 전달되지 않도록 설계된 ‘안전’기반 시스템의 생성에서 부족하고 비싼 상품입니다. Midjourney 및 Chatgpt의 이미지 생성 용량과 같은.
따라서 스위스, 소니 AI 및 중국 간의 새로운 학업 협력이 카피 판사 -저작권 침해의 징후에 대한 입력을 조사 할 수있는 ChatGpt 기반 ‘심사 위원’을 충돌하는 연속적인 그룹을 조정하는 자동화 된 방법.
Copyjudge는 다양한 IP- 피킹 AI 세대를 평가합니다. 출처 : https://arxiv.org/pdf/2502.15278
CopyJudge는 저작권이있는 이미지와 텍스트-이미지 확산 모델에 의해 생성 된 이미지 사이의 실질적인 유사성을 결정하기 위해 LVLM (Large Vision-Language Models)을 활용하는 자동화 된 프레임 워크를 효과적으로 제공합니다.
Copyjudge 접근 방식은 강화 학습 및 기타 접근 방식을 사용하여 저작권 내 프롬프트를 최적화 한 다음 그러한 프롬프트의 정보를 사용하여 저작권 이미지를 호출 할 가능성이 적은 새로운 프롬프트를 만듭니다.
많은 온라인 AI 기반 이미지 생성기는 NSFW, 저작권이있는 자료, 실제 사람들의 레크리에이션 및 기타 금지 된 도메인에 대한 사용자의 프롬프트를 필터링하지만, Copyjudge는 대신에 정제 된 ‘침해’프롬프트를 사용하여 허용되지 않은 퇴장 가능성이 가장 적은 ‘소독’프롬프트를 만듭니다. 사용자의 제출을 직접 차단하려는 의도없이 이미지.
이것은 새로운 접근법은 아니지만 API 기반 생성 시스템을 단순히 사용자의 입력을 거부하지 못하도록 방해하는 방법이 있습니다 (최소한 사용자가 개발할 수 있기 때문일 수 있습니다. 백도어 액세스 실험을 통해 세대를 허용하지 않았습니다).
최근에 개발자가 폐쇄 한 이래로 사용자는 이미지-비디오 워크 플로우에 업로드 된 이미지에 AA의 크로스 또는 십자가를 포함하여 Kling 생성 AI 플랫폼에서 포르노 자료를 생성 할 수있게되면.
2024 년 후반 Kling 개발자가 패치 한 허점에서 사용자는 시스템이 I2V 시드 이미지에 크로스 또는 십자가를 포함하여 금지 된 NSFW 출력을 생성하도록 강요 할 수 있습니다. 이 넓은 해킹의 논리에 대한 설명은 없었습니다. 출처 : 불화
이와 같은 사례는 온라인 생성 시스템에서 신속한 소독의 필요성을 강조합니다. 환영받지 못한 효과 최종 모델의 유용성.
덜 과감한 솔루션을 찾는 Copyjudge 시스템은 AI를 사용하여 조성 및 색상과 같은 주요 요소로 이미지를 분해하여 인간 기반의 법적 판단을 모방하여 공동 구조화 할 수없는 부품을 걸러 내고 남아있는 것을 비교합니다. 또한 프롬프트를 조정하고 이미지 생성을 수정하는 AI 구동 방법이 포함되어 있으며, 창의적인 콘텐츠를 보존하는 동안 저작권 문제를 피하는 데 도움이됩니다.
실험 결과, 저자는이 추구에서 최첨단 접근 방식과 Copyjudge의 동등성을 보여주고 시스템이 우수하다는 것을 나타냅니다. 일반화 이전 작업과 비교할 때 해석 가능성.
그만큼 새로운 종이 제목이 있습니다 Copyjudge : 텍스트-이미지 확산 모델의 자동 저작권 침해 식별 및 완화EPFL, Sony AI 및 중국의 Westlake University에서 5 명의 연구원이 왔습니다.
방법
CopyJudge는 GPT를 사용하여 자동 판사의 롤링 재판소를 만들지 만 저자는 시스템이 OpenAI 제품에 최적화되지 않았으며 대체 대형 대규모 비전 언어 모델 (LVLM)을 대신 사용할 수 있다고 강조합니다.
첫 번째로, 저자의 추상화-여과 비교 프레임 워크는 아래 스키마의 왼쪽에 표시된 것처럼 소스 이미지를 구성 부분으로 분해하기 위해 필요합니다.
Copyjudge 워크 플로의 초기 단계에 대한 개념 스키마.
왼쪽 하단 코너에서 우리는 필터링 에이전트가 이미지 섹션을 분해하는 것을 볼 수 있습니다. 콘서트에서 저작권이있는 작품에 기초 할 수있는 특성이지만 그 자체로는 위반 자격을 갖추기에는 너무 일반적입니다.
여러 LVLM이 필터링 된 요소를 평가하는 데 사용됩니다. 2023 CSAIL과 같은 논문에서 효과적인 접근법 헌금 다기관 토론을 통해 언어 모델의 사실과 추론 개선그리고 체테 발새로운 논문에서 인정 된 다양한 다른 사람들 중에서.
저자 상태 :
‘[We] 각 LVLM이 [responses] 에서 [other] 다음 판단을하기 전에 LVLM. 이는 모델이 동료들이 제시 한 새로운 통찰력을 기반으로 평가를 조정하기 때문에 분석의 신뢰성과 깊이를 강화하는 동적 피드백 루프를 만듭니다.
‘각 LVLM은 다른 LVLM의 응답에 따라 점수를 조정하거나 변경되지 않도록 유지할 수 있습니다.’
인간이 점수를 매기는 여러 쌍의 이미지도 소수의 컨텍스트 학습을 통해 프로세스에 포함됩니다.
루프의 ‘재판소’가 수용 가능성 범위 내에있는 합의 점수에 도달하면 결과는 ‘Meta Judge’LVLM으로 전달되어 결과를 최종 점수로 종합합니다.
완화
다음으로 저자는 앞에서 설명한 프롬프트 완화 프로세스에 집중했습니다.
프롬프트와 잠재적 소음을 정제하여 저작권 침해를 완화하기위한 Copyjudge의 스키마. 이 시스템은 프롬프트가 진화함에 따라 잠재 변수를 수정하기 위해 강화 학습을 사용하여 반복적으로 프롬프트를 반복적으로 조정하여 침해 위험을 줄입니다.
프롬프트 완화에 사용되는 두 가지 방법은 LVLM 기반 프롬프트 제어 였는데, 이곳에서 효과적인 비 침입 프롬프트는 GPT 클러스터에 걸쳐 반복적으로 개발되며, 완전히 ‘블랙 박스’라는 접근 방식은 모델 아키텍처에 대한 내부 액세스가 필요하지 않습니다. 그리고 a 강화 학습-기반 (RL 기반) 접근법.
데이터 및 테스트
CopyJudge를 테스트하기 위해 다양한 데이터 세트가 사용되었습니다 D-Rep여기에는 인간이 0-5 등급으로 득점 한 실제 및 가짜 이미지 쌍이 포함되어 있습니다.
포옹 페이스에서 D-Rep 데이터 세트 탐색. 이 컬렉션은 실제 및 생성 된 이미지를 짝을 이룹니다. 출처 : https://huggingface.co/datasets/wenhaowang/d-rep/viewer/default/
Copyjudge 스키마는 4 개 이상의 충족을 침해 예제로 고려했으며 나머지는 IIP가 아닌 것으로 보였습니다. 데이터 세트의 4000 개의 공식 이미지는 테스트 이미지와 같이 사용되었습니다. 또한 연구원들은 Wikipedia의 유명한 만화 캐릭터 10 개를 선택하고 선별했습니다.
잠재적으로 침해하는 이미지를 생성하는 데 사용되는 세 가지 확산 기반 아키텍처는 안정적인 확산 v2; Kandinsky2-2; 그리고 안정적인 확산 XL. 저자는 각 모델에서 침해 이미지와 비 침해 이미지를 수동으로 선택하여 60 개의 양성 및 60 개의 음성 샘플에 도달했습니다.
비교를 위해 선택된 기준 방법은 다음과 같습니다. 엘2 표준; 배운 지각 이미지 패치 유사성 (LPIPS); SSCD; RLCP; 그리고 PDF-EMB. 메트릭, 정확도 및 F1 점수 침해 기준으로 사용되었습니다.
GPT-4O는 제출 된 특정 이미지에서 최대 5 개의 반복을 위해 3 명의 에이전트를 사용하여 Copyjudge의 내부 토론 팀을 채우는 데 사용되었습니다. D-REP의 각 등급에서 무작위 3 개의 이미지가 인간으로 사용되었습니다. 사전 에이전트가 고려해야합니다.
1 라운드에서 Copyjudge의 침해 결과.
이 결과 중 저자는 다음과 같이 언급합니다.
‘[It] 전통적인 이미지 사본 탐지 방법은 저작권 침해 식별 작업에서 제한을 나타냅니다. 우리의 접근 방식은 대부분의 방법을 훨씬 능가합니다. 최첨단 방법 인 PDF-EMB는 D-REP에서 36,000 개의 샘플을 훈련 시켰으며, D-REP에 대한 우리의 성능은 약간 열등합니다.
그러나 만화 IP 및 아트 워크 데이터 세트의 성능 저하는 일반화 기능 부족을 강조하는 반면, 우리의 방법은 데이터 세트에서 똑같이 우수한 결과를 보여줍니다. ‘
저자는 또한 Copyjudge가 유효한 사례와 침해 사례간에 ‘상대적으로’더 뚜렷한 경계를 제공한다고 지적합니다.
새 논문의 보충 자료에서 테스트 라운드의 추가 예.
연구원들은 그들의 방법을 소니 AI와 관련하여 비교했습니다 협동 2024 년부터 제목 확산 모델에서 암기를 탐지, 설명 및 완화. 이 작업은 추론 시간에 저작권을 가진 데이터를 유발하기 위해 200 개의 암기 (예 : 과제) 이미지를 특징으로하는 미세 조정 된 안정 확산 모델을 사용했습니다.
새로운 작품의 저자는 2024 년 접근 방식과 비교하여 자신의 신속한 완화 방법이 침해를 유발할 가능성이 적은 이미지를 생성 할 수 있음을 발견했습니다.
Copyjudge와의 암기 완화 결과는 2024 년 작업에 반대했습니다.
저자는 여기에 다음과 같습니다.
‘[Our] 접근 방식은 침해를 유발할 가능성이 낮은 이미지를 생성하면서 비슷하고 약간 감소 된 성냥 정확도를 유지할 수 있습니다. 표시된대로 [image below]우리의 방법은 효과적으로 단점을 피합니다 [the previous] 암기를 완화하지 못하거나 고도로 벗어난 이미지 생성을 포함한 방법. ‘
암기를 완화 전후에 생성 된 이미지와 프롬프트의 비교.
저자는 침해 완화와 관련하여 추가 테스트를 실시했습니다. 명백한 그리고 절대적인 위반.
명백한 침해 프롬프트가 저작권이있는 자료를 직접 참조 할 때 발생합니다 ‘미키 마우스의 이미지 생성’. 이를 테스트하기 위해 연구원들은 20 개의 만화와 아트 워크 샘플을 사용하여 이름이나 저자 속성을 명시 적으로 포함하는 안정적인 확산 v2에서 침해 이미지를 생성했습니다.
저자의 잠재 제어 (LC) 방법과 이전 작업의 프롬프트 제어 (PC) 방법을 다양한 변형으로 안정적인 확산을 사용하여 명시 적 침해를 묘사 한 이미지를 생성합니다.
암시 적 침해 프롬프트가 명시적인 저작권 참조가 부족하지만 특정 설명 요소로 인해 여전히 침해 이미지를 초래할 때 발생합니다. 즉, 상용 텍스트-이미지 모델과 관련된 시나리오는 종종 컨텐츠 감지 시스템을 통합하여 저작권 관련 프롬프트를 식별하고 차단합니다. .
이를 탐색하기 위해 저자는 명시 적 침해 테스트에서와 동일한 IP 잠금 샘플을 사용했지만 Dall-E 3을 사용하여 직접 저작권 참조없이 침해 이미지를 생성했습니다 (논문은 모델의 내장 안전 감지 모듈이 관찰되었음을 기록했지만 필터를 트리거 한 특정 프롬프트를 거부합니다).
Dalle-3을 사용한 암시 적 침해, 침해 및 클립 점수.
저자 상태 :
‘[It] 우리의 방법은 클립 점수가 약간 떨어지면서 명시 적 및 암시 적 침해 모두에 대한 침해 가능성을 크게 줄인다는 것을 알 수 있습니다. 잠재적 인 제어 후에 만 침해 점수는 프롬프트를 변경하지 않고 비 침입 잠재를 검색하는 것이 매우 어렵 기 때문에 프롬프트 제어 후보다 상대적으로 높습니다. 그러나 더 높은 이미지 텍스트 매칭 품질을 유지하면서 침해 점수를 효과적으로 줄일 수 있습니다.
‘[The image below] 사용자 요구 사항을 보존하는 동안 IP 침해를 피하는 것을 관찰 할 수있는 시각화 결과를 보여줍니다. ‘
IP 침해 완화 전후에 생성 된 이미지.
결론
이 연구는 AI 생성 이미지에서 저작권 보호에 대한 유망한 접근 방식을 제시하지만, AI 중심 판단이 항상 법적 표준과 일치하지는 않기 때문에 침해 탐지에 대한 대규모 비전 언어 모델 (LVLM)에 대한 의존도는 편견과 일관성에 대한 우려를 제기 할 수 있습니다. .
아마도 가장 중요한 것은이 프로젝트는 또한 AI가 해석하기 위해 고군분투 할 수있는 주관적이고 맥락적인 요소를 포함하는 실제 법적 결정에도 불구하고 저작권 집행이 자동화 될 수 있다고 가정합니다.
현실 세계에서, 특히 AI의 생산량에 대한 법적 합의의 자동화는이 시간을 훨씬 넘어서서이 작업에서 다루는 영역의 범위를 훨씬 넘어서는 것으로 보인다.
2025 년 2 월 24 일 월요일에 처음 출판되었습니다
게시물 AI 생성 이미지의 저작권 보호 자동화 먼저 나타났습니다 Unite.ai.