오픈소스 AI는 지금 어디에나 있습니다. 문제는 아무도 이에 동의하지 않는다는 것입니다. 실제로 그것이 무엇인가. 이제 우리는 마침내 답을 얻을 수 있을 것입니다. 오픈 소스가 무엇을 의미하는지에 대한 자칭 중재자, 오픈 소스 이니셔티브(OSI)가 새로운 정의를 발표했는데, 이를 통해 입법자들이 소비자를 AI 위험으로부터 보호하기 위한 규정을 개발하는 데 도움이 되기를 바랍니다.
OSI는 다른 분야에서 오픈소스 기술을 구성하는 것에 대해 많은 것을 발표했지만, 이번이 AI 모델에 대한 용어를 정의하려는 첫 시도입니다. 연구자, 변호사, 정책 입안자, 활동가로 구성된 70명의 그룹과 Meta, Google, Amazon과 같은 대형 기술 기업의 대표에게 작업 정의를 내놓으라고 요청했습니다.
그룹에 따르면 오픈 소스 AI 시스템은 다음과 같습니다. 어떠한 목적으로도 사용됨 허가를 받지 않고도 연구자들은 다음을 수행할 수 있어야 합니다. 구성 요소를 검사하고 시스템 작동 방식을 연구합니다..
또한 가능해야 합니다 어떤 목적에든 시스템을 수정하다—포함하여 출력을 변경하다—그리고 다른 사람들과 공유해서 사용하세요, 수정 여부와 관계없이, 어떤 목적을 위해서든. 또한 이 표준은 주어진 모델의 학습 데이터, 소스 코드 및 가중치에 대한 투명성 수준을 정의하려고 시도합니다.
이전에 오픈소스 표준이 부족했던 것이 문제가 되었습니다. OpenAI와 Anthropic이 모델, 데이터 세트, 알고리즘을 비밀로 유지하기로 한 결정이 AI를 닫은 출처, 일부 전문가들은 Meta와 Google의 자유롭게 접근 가능한 모델은 누구나 검토하고 수정할 수 있지만, 사용자가 모델로 할 수 있는 일을 제한하는 라이선스와 교육 데이터 세트가 공개되지 않았기 때문에 진정한 오픈 소스가 아니라고 주장합니다. Meta, Google, OpenAI는 새로운 정의에 대한 답변을 요청받았지만 출판 전에는 답변하지 않았습니다.
AI 모델을 구축하고 공유하는 플랫폼인 Hugging Face의 응용 정책 연구원인 Avijit Ghosh는 “기업들이 모델을 마케팅할 때 이 용어를 오용하는 것으로 알려져 있습니다.”라고 말합니다. 연구자들이 실제로 모델을 오픈 소스로 독립적으로 조사할 수 없더라도 모델을 오픈 소스로 설명하면 더 신뢰할 수 있는 것으로 인식될 수 있습니다. ~이다 오픈소스.
모질라의 수석 고문이자 OSI 프로세스 참여자인 아야 브데이르는 오픈소스 정의의 특정 부분은 비교적 합의하기 쉬웠으며, 여기에는 모델 가중치(AI 모델이 출력을 생성하는 방식을 결정하는 데 도움이 되는 매개변수)를 공개해야 할 필요성이 포함된다고 말합니다. 심의의 다른 부분은 더 논란이 많았으며, 특히 공개 훈련 데이터가 어떻게 되어야 하는지에 대한 질문이 그렇습니다.
훈련 데이터의 출처에 대한 투명성 부족으로 인해 OpenAI와 같은 대규모 언어 모델 제조업체부터 대형 AI 회사를 상대로 수많은 소송이 제기되었습니다. 음악 생성기 Suno와 같이, “공개적으로 접근 가능한 정보”를 포함한다고 말하는 것 외에는 훈련 세트에 대해 많은 것을 공개하지 않습니다. 이에 대응하여 일부 옹호자들은 오픈소스 모델은 모든 훈련 세트를 공개해야 한다고 말하는데, Bdeir는 저작권 및 데이터 소유권과 같은 문제로 인해 이 표준을 시행하기 어려울 것이라고 말합니다.
궁극적으로 새로운 정의는 오픈소스 모델이 “숙련된 사람이 동일하거나 유사한 데이터를 사용하여 실질적으로 동등한 시스템을 재생성할 수 있는” 정도로 교육 데이터에 대한 정보를 제공해야 한다는 것을 요구합니다. 모든 교육 데이터 세트를 공유해야 한다는 일괄적인 요구 사항은 아니지만 오늘날 많은 독점 모델 또는 표면적으로 오픈소스 모델이 하는 것보다 더 나아갑니다. 타협입니다.
“실제로 아무도 효과적으로 충족시킬 수 없는 이념적으로 순수한 금본위제를 고집하는 것은 결국 역효과를 낳습니다.”라고 Bdeir는 말합니다. 그녀는 OSI가 일종의 시행 메커니즘을 계획하고 있으며, 이는 오픈 소스로 설명되지만 정의를 충족하지 않는 모델을 표시합니다. 또한 새로운 정의를 충족하는 AI 모델 목록을 공개할 계획입니다. 아직 확인된 것은 없지만 Bdeir가 말한 소수의 모델은 MIT 기술 리뷰 이 목록에 포함될 것으로 예상되는 이름으로는 Eleuther의 Pythia, Ai2의 OLMo, 오픈소스 콜렉티브 LLM360의 모델 등 상대적으로 규모가 작은 프로젝트들이 있습니다.