덴 그 리바 우스 카스 Web Intelligence Collection 및 Premium Proxy Solutions의 글로벌 리더 인 Oxylabs의 최고 거버넌스 및 전략 책임자입니다.
2015 년에 설립, 옥실 라브 195 개국에 걸쳐 1 억 7,700 만 명의 IPS를 제공하는 Web Unblocker, Web Scraper API 및 OxyCopilot과 같은 고급 도구를 사용하여 자연 언어를 구조화 된 데이터 쿼리로 변환하는 AI 구동 스크랩 링 보조원과 함께 세계에서 가장 큰 윤리적으로 공급되는 프록시 네트워크 중 하나를 제공합니다.
리투아니아의 법적 기술 공간에서 인상적인 법률 및 거버넌스 여행을했습니다. Oxylabs에서의 역할에서 AI의 가장 양극화 된 과제 중 하나 인 윤리 및 저작권 중 하나를 개인적으로 동기를 부여한 이유는 무엇입니까?
옥실 라브는 항상 업계에서 책임있는 혁신의 깃발을 깃발했습니다. 우리는 윤리적 대리 소싱 및 웹 스크래핑 산업 표준을 처음으로 옹호했습니다. 이제 AI가 너무 빨리 움직이면 혁신이 책임과 균형을 이루어야합니다.
우리는 이것을 AI 산업에 직면 한 큰 문제로 보았으며 솔루션도 볼 수있었습니다. 이러한 데이터 세트를 제공함으로써 AI 회사와 제작자는 공정한 AI 개발과 관련하여 같은 페이지에있을 수 있습니다. 이는 관련된 모든 사람에게 유익합니다. 우리는 제작자의 권리를 최전선에 유지하고 미래 AI 시스템의 개발을위한 컨텐츠를 제공하는 것이 얼마나 중요한지 알았으므로 이러한 데이터 세트를 오늘날 시장의 요구를 충족시킬 수있는 것으로 만들었습니다.
영국은 격렬한 저작권 전투 중에 있으며 양쪽에 강한 목소리가 있습니다. AI 혁신과 제작자 권리 사이의 논쟁의 현재 상태를 어떻게 해석합니까?
영국 정부가 생산적인 기술 혁신을 우선 순위로 선호하는 것이 중요하지만, 제작자는 AI가 도난 당하지 않고 AI에 의해 향상되고 보호 해야하는 것이 중요합니다. 현재 토론중인 법적 틀은 혁신을 육성하고 동시에 제작자를 보호하는 것 사이의 달콤한 지점을 찾아야하며 앞으로 몇 주 안에 균형을 잡는 방법을 찾기를 바랍니다.
Oxylabs는 방금 AI 교육에 대한 제작자의 동의가 필요한 세계 최초의 윤리적 YouTube 데이터 세트를 출시했습니다. 이 동의는 정확히 어떻게 작동하며, 음악이나 출판과 같은 다른 산업에서는 얼마나 확장 가능한가?
데이터 세트의 수백만 개의 독창적 인 비디오는 제작자와 혁신가를 윤리적으로 연결하는 데 사용될 제작자의 명시 적 동의를 가지고 있습니다. Oxylabs에서 제공하는 모든 데이터 세트에는 비디오, 성적표 및 풍부한 메타 데이터가 포함됩니다. 이러한 데이터에는 많은 잠재적 인 사용 사례가 있지만, Oxylabs는 개선 및 AI 훈련을 위해 특별히 준비했으며, 이는 콘텐츠 제작자가 고의적으로 동의 한 사용입니다.
많은 기술 리더들은 모든 제작자들로부터 명백한 옵트 인을 요구하면 AI 산업을“죽일”할 수 있다고 주장합니다. 그 주장에 대한 귀하의 반응은 무엇이며 Oxylabs의 접근 방식은 어떻게 그렇지 않습니까?
AI 훈련을위한 자료의 모든 사용에 대해, 이전의 명시 적 옵트 인은 상당한 운영 문제를 제시하고 AI 혁신에 상당한 비용이 발생할 것입니다. 제작자의 권리를 보호하는 대신, 의도하지 않은 회사가 덜 엄격한 집행 또는 다른 저작권 제도를 통해 개발 활동을 관할 구역으로 전환하도록 장려 할 수 있습니다. 그러나 이것은 저작권을 존중하는 동안 AI 개발이 장려되는 중간 근거가 없다는 것을 의미하지는 않습니다. 반대로, 우리에게 필요한 것은 AI 회사와 제작자 간의 관계를 단순화하는 실행 가능한 메커니즘입니다.
이 데이터 세트는 앞으로 나아가는 한 가지 방법을 제공합니다. 저작권 소유자가 명시 적으로 선택하지 않는 한 컨텐츠를 사용할 수있는 옵트 아웃 모델은 다른 컨텐츠입니다. 세 번째 방법은 온라인 플랫폼과 같은 기술 솔루션을 통해 게시자, 제작자 및 AI 회사 간의 거래를 촉진하는 것입니다.
궁극적으로 모든 솔루션은 해당 저작권 및 데이터 보호법의 경계 내에서 작동해야합니다. Oxylabs에서는 AI 혁신이 책임감있게 추구되어야한다고 생각하며, 우리의 목표는 진보를 가능하게하면서 제작자를 존중하는 합법적이고 실용적인 틀에 기여하는 것입니다.
동의 기반 데이터 세트를 실행하기 위해 팀이 극복해야 할 가장 큰 장애물은 무엇입니까?
우리의 길은 YouTube에 의해 열려서 콘텐츠 제작자가 AI 교육을 위해 자신의 작업을 쉽고 편리하게 라이센스 할 수있게했습니다. 그 후, 우리의 작업은 대부분 데이터 수집, 데이터 세트를 준비하기 위해 데이터 수집 및 구조화, 회사가 필요한 데이터에 액세스 할 수 있도록 전체 기술 설정을 구축하는 것이 대부분 기술적이었습니다. 그러나 이것은 우리가 몇 년 동안, 어떤 식 으로든 해왔 던 일입니다. 물론 각 사례는 자체 도전 과제를 제시합니다. 특히 멀티 모달 데이터만큼 거대하고 복잡한 것을 다룰 때. 그러나 우리는이를 수행 할 수있는 지식과 기술적 능력을 모두 가지고있었습니다. 이를 감안할 때 YouTube 저자가 동의 할 기회를 얻었을 때 나머지는 우리의 시간과 자원을 넣는 문제 일뿐입니다.
YouTube 컨텐츠 외에도 음악, 작문 또는 디지털 아트와 같은 다른 주요 컨텐츠 유형이 교육 데이터로 사용하도록 체계적으로 라이센스를 부여하는 미래를 구상합니까?
한동안, 우리는 AI 혁신을 가능하게하면서 제작자 권리와 균형을 이룰 수 있도록 동의 조작 및 콘텐츠 라이센스에 대한 체계적인 접근의 필요성을 지적하고 있습니다. 양측이 목표를 달성하는 편리하고 협력적인 방법이있을 때만 상호 이익이 될 것입니다.
이것은 시작일뿐입니다. 우리는 다양한 산업 전반에 걸쳐 우리와 같은 데이터 세트를 제공하면 최종적으로 저작권 토론을 우호적 인 가까운 곳에 가져 오는 솔루션을 제공 할 수 있다고 생각합니다.
Oxylabs의 윤리적 데이터 세트와 같은 제품의 중요성은 EU, 영국 및 기타 관할 구역의 AI 거버넌스 접근 방식에 따라 다릅니 까?
한편으로, 명시 적으로 인한 기반 데이터 세트의 가용성은 정부가 더 엄격한 규제를 향한 관할 구역에 기반을 둔 AI 회사의 분야를 수준합니다. 이 회사의 주요 관심사는 제작자를 지원하기보다는 동의를 얻는 엄격한 규칙이 다른 관할 구역의 AI 개발자에게만 불공평 한 이점을 제공한다는 것입니다. 문제는이 회사들이 동의에 신경 쓰지 않고 오히려 편리한 방법이 없다면 뒤쳐져 나가는 것이 좋습니다.
다른 한편으로, 우리는 동의를 부여하고 AI 교육을 위해 라이센스가 부여 된 데이터에 액세스하는 경우이 접근법이 전 세계적으로 선호되는 방식이되어서는 안되는 이유가 없다고 생각합니다. 라이센스가 부여 된 YouTube 컨텐츠를 기반으로 구축 된 데이터 세트는 이러한 단순화를 향한 단계입니다.
AI가 어떻게 훈련되는지에 대한 대중의 불신이 증가함에 따라, 투명성과 동의가 기술 회사의 경쟁력있는 이점이 될 수 있다고 생각하십니까?
투명성은 종종 경쟁 우위에 대한 방해물로 여겨지지만 불신과 싸우는 것은 또한 우리의 가장 큰 무기이기도합니다. AI 기업이 더 많은 투명성을 제공할수록 윤리적이고 유익한 AI 교육에 대한 증거가 더 많아서 AI 산업에 대한 신뢰를 재건합니다. 그리고 제작자들은 자신과 사회가 AI 혁신으로부터 가치를 얻을 수 있다는 것을보고 미래에 동의 할 더 많은 이유가있을 것입니다.
Oxylabs는 종종 데이터 스크래핑 및 웹 인텔리전스와 관련이 있습니다. 이 새로운 윤리적 이니셔티브는 회사의 광범위한 비전에 어떻게 적합합니까?
윤리적으로 공급되는 YouTube 데이터 세트의 출시는 윤리 산업 관행을 확립하고 홍보하기위한 Oxylabs에서 우리의 사명을 계속합니다. 이에 따라 EWDCI (Ethical Web Data Collection Initiative)를 공동 설립하고 프록시 소싱을위한 업계 최초의 투명한 계층 프레임 워크를 도입했습니다. 또한 연구원과 학자가 연구 영향을 극대화하고 중요한 공개 웹 데이터에 대한 이해를 향상시킬 수 있도록하는 사명의 일환으로 Project 4β를 출시했습니다.
앞으로 정부가 훈련 데이터에 대한 동의에 따라 동의해야한다고 생각합니까, 아니면 자발적인 산업 주도 이니셔티브로 남아 있어야합니까?
자유 시장 경제에서는 일반적으로 시장을 교정하는 것이 가장 좋습니다. 우리는 시장의 요구에 부응하여 혁신을 개발할 수있게함으로써 지속적으로 번영을 재창조하고 새롭게합니다. 손으로 입법은 결코 좋은 선택이 아니며 혁신을 허용하면서 정의를 보장하기 위해 다른 모든 수단이 소진되었을 때만 의지해야합니다.
AI 훈련에서 이미 그 시점에 도달 한 것처럼 보이지 않습니다. 제작자와 데이터 세트를위한 YouTube의 라이센스 옵션은이 생태계가 새로운 현실에 적응할 수있는 방법을 적극적으로 찾고 있음을 보여줍니다. 따라서, 분명한 규제는 물론 모든 사람이 자신의 권리 내에서 행동하도록해야하지만 정부는 가볍게 밟고 싶어 할 수 있습니다. 모든 경우에 표현 된 동의를 요구하기보다는 산업이 현재 긴장을 해결하기위한 메커니즘을 개발할 수있는 방법을 조사하고 입법에 따라 혁신을 방해하는 것이 아니라 혁신을 장려 할 때 신호를 받아 들일 수 있습니다.
혁신을 중단하지 않고 윤리적 데이터 사용을 우선 순위로 삼고 자하는 신생 기업 및 AI 개발자에게 어떤 조언을 제공 하시겠습니까?
한 가지 방법 스타트 업은 윤리적 데이터 사용을 촉진하는 데 도움이 될 수 있습니다. 동의를 얻고 제작자의 가치를 도출하는 프로세스를 단순화하는 기술 솔루션을 개발하는 것입니다. 투명하게 공급되는 데이터를 획득하는 옵션으로 인해 AI 회사는 속도를 손상시킬 필요가 없습니다. 그러므로 나는 그들에게 그러한 제품을 위해 눈을 뜨도록 조언합니다.
훌륭한 인터뷰에 감사드립니다. 더 배우고 싶은 독자들은 방문해야합니다. 옥실 라브.
게시물 Denas Grybauskas, Oxylabs의 최고 거버넌스 및 전략 책임자 – 인터뷰 시리즈 먼저 나타났습니다 Unite.ai.