라이언 쾰른 의 최고 경영자(CEO)이자 전무이사입니다. 앱. Ryan은 Appen의 비즈니스와 AI 산업에 대한 깊은 이해와 함께 기술 및 통신 분야에서 20년 이상의 글로벌 경험을 제공합니다.
그의 전문 경력은 호주, 아시아 및 북미 지역의 모바일 네트워크 데이터 엔지니어링에 중점을 두고 엔지니어로 시작되었습니다. 뉴욕 대학교에서 MBA를 마친 Ryan은 2011년에 보스턴 컨설팅 그룹(BCG)에 전략 컨설턴트로 합류했습니다. BCG에서 근무하는 동안 그는 기술 및 통신을 전문으로 했으며 다양한 성장 및 운영 주제에 걸쳐 심층적인 전략 전문 지식을 얻었습니다.
2018년 기업 개발 부사장으로 Appen AI에 합류한 그는 Figure Eight 및 Quadrant와 같은 전략적 인수를 주도하고 중국 및 연방 사업부 설립을 지원했습니다. CEO로 임명되기 전에는 최고 운영 책임자(COO)로 재직하면서 글로벌 운영과 전략을 감독했습니다.
기술 및 통신 분야에서 20년 이상의 경험을 쌓은 귀하의 경력 경로는 빠르게 진화하는 AI 환경에서 Appen을 선도하는 접근 방식을 어떻게 형성했습니까?
제 경력은 통신 엔지니어로 시작되었습니다. 제 역할은 네트워크를 구축 및 최적화하는 것이었고, 엄청난 양의 데이터와 분석을 포함하고 네트워크 성능과 고객 경험을 최적화하기 위한 혁신적인 솔루션을 찾는 것이었습니다.
NYU에서 MBA를 마친 후 기술 전략 및 인수 합병 분야의 리더십 역할로 발전하여 새로운 트렌드, 투자 기회 및 비즈니스 모델과 같은 더 큰 전략적 질문에 집중했습니다. 이러한 배경을 통해 저는 신흥 기술의 기술적 측면과 비즈니스 측면 모두에 대한 깊은 이해를 갖게 되었습니다.
Appen에서 우리는 AI와 데이터의 교차점에서 일하고 있으며, 나의 경험을 통해 나는 회사를 이끌고 빠르게 진화하는 AI 공간에서 복잡성을 탐색하고 음성 인식, NLP, 추천 시스템 및 현재의 생성 AI와 같은 주요 개발을 진행해 나갈 수 있었습니다. . AI가 전 세계적으로 산업을 지속적으로 변화시키고 있기 때문에 이러한 전략적 비전은 매우 중요합니다.
2018년부터 Appen과 함께 하셨습니다. Figure Eight 및 Quadrant와 같은 주요 인수. 이러한 전략적 움직임은 어떻게 Appen을 AI 데이터 서비스의 리더로 자리매김하게 했으며 회사의 다음 큰 기회는 무엇이라고 생각하시나요?
Figure Eight 및 Quadrant의 인수는 특히 데이터 주석 및 지리 위치 정보와 같은 영역에서 AI 데이터 기능을 확장하는 데 핵심이었습니다. Figure Eight의 데이터 주석 플랫폼은 특히 영향력이 컸습니다. 이 플랫폼은 고도로 사용자 정의가 가능하며 다양한 도메인의 작업에 사용해 왔습니다. 최근에는 이 플랫폼을 활용하여 대부분의 생성 AI 데이터 흐름을 실행하고 있습니다.
인수 외에도 약 5년 전에 우리는 중국에 Appen China라는 사업장을 설립했습니다. 우리는 현재 중국 최대의 AI 데이터 회사로, 매출이 가장 가까운 경쟁사보다 거의 두 배나 높습니다.
앞으로 Appen의 초점은 생성 AI의 개발 및 채택을 지원하는 것입니다. 모델 구축업체와 생성 AI를 제품 및 운영에 도입하려는 기업 모두에게 큰 성장 기회가 있습니다. 우리는 이제 막 가장 큰 AI 물결의 시작점에 와 있다고 생각합니다.
데이터 품질은 AI 모델 개발에서 중요한 역할을 합니다. 특히 고품질 LLM 교육 데이터에 대한 수요가 증가함에 따라 Appen이 데이터 세트의 정확성, 다양성 및 관련성을 어떻게 보장하는지 공유해 주실 수 있습니까?
Appen의 강점은 고품질 데이터를 일관되고 대규모로 생성하는 능력입니다. 우리는 자동화된 도구와 인간의 피드백을 결합한 다층적 접근 방식을 통해 고객과 긴밀히 협력하여 고객의 AI 모델 목표를 이해하고 요구 사항에 맞는 고품질 데이터를 개발합니다. 우리는 200개 이상의 국가에 걸쳐 100만 명 이상의 글로벌 인력을 보유하고 있으며 이를 통해 자격을 갖춘 다양한 기여자 그룹을 선별할 수 있습니다. 엄격한 품질 관리와 피드백 루프를 통해 데이터가 정확하고 일관되며 관련성이 있는지 확인하고 AI 모델의 성능을 효과적으로 개선하는 데 사용할 수 있습니다. 이를 통해 AI 시스템은 실제 환경에서 효과적으로 작동할 수 있으며 특히 LLM의 경우 견고성을 향상하고 편견을 줄이는 데 사용할 수도 있습니다.
합성 데이터 세대가 인기를 얻고 있으며 Mindtech에 대한 Appen의 투자는 이 분야에 대한 귀하의 관심을 강조합니다. AI 모델 훈련을 위해 합성 또는 웹 스크랩 데이터와 크라우드소싱 데이터를 사용할 때의 장단점에 대해 논의하고, Appen의 유명한 크라우드소싱 데이터를 보완하는 합성 데이터를 어떻게 보는지 논의해 주실 수 있나요?
고품질 데이터는 중요하지만 생성하는 데 비용과 시간이 많이 소요될 수 있으므로 합성 데이터가 주목을 받고 있습니다. 이는 개인 정보 사용을 방지하므로 특히 의료 및 금융과 같이 개인 정보 보호 규정이 엄격한 산업에서 전통적인 AI/ML 작업의 구조화된 데이터에 적합합니다.
그러나 합성 데이터에는 실제 데이터의 깊이와 뉘앙스가 부족한 경우가 많습니다. 특히 다양성과 깊이 있는 전문 지식이 필요한 복잡한 생성 AI 작업의 경우 더욱 그렇습니다. 또한 원본 데이터의 오류나 편향이 지속될 수도 있습니다. LLM에 일반적으로 사용되는 웹 스크랩 데이터는 품질이 낮은 콘텐츠, 편견, 잘못된 정보로 인해 신중한 선별이 필요한 자체적인 문제를 제시합니다.
Appen이 전문으로 하는 크라우드소싱 데이터는 여전히 “지상 진실”로 남아 있습니다. AI 모델의 정확성을 높이고 인간의 가치에 부합하는 데 필요한 다양하고 복잡한 데이터를 생성하려면 인간의 전문 지식이 필수적입니다.
우리는 합성 데이터를 사람이 주석을 추가한 데이터를 보완하는 것으로 봅니다. 합성 데이터는 프로세스의 일부를 가속화할 수 있지만, 사람이 라벨을 붙인 데이터는 모델이 실제 다양성을 반영하도록 보장합니다. 이들은 함께 AI를 위한 고품질 교육 데이터를 생성하기 위한 균형 잡힌 접근 방식을 제공합니다.
그만큼 나는 행동한다 및 기타 글로벌 규정이 AI 개발에 관한 윤리적 표준을 형성하고 있습니다. 이러한 규정이 Appen의 운영과 더 넓은 AI 산업의 발전에 어떤 영향을 미칠 것으로 보시나요?
EU AI법 및 이와 유사한 글로벌 규정은 AI 모델 개발 및 성능에 대한 새로운 윤리적 기준을 설정함으로써 Appen의 운영에 영향을 미칠 가능성이 높습니다. 데이터 처리 방법, 모델 공정성 보장 방법, 윤리적 고려 사항 처리 방법에 변화가 있을 수 있습니다. 이로 인해 모델 교육 및 검증에 대한 접근 방식이 더욱 엄격해지고 잠재적인 조정이 이루어질 수 있습니다.
대체로 이러한 규정은 업계를 더 높은 윤리 기준으로 이끌고, 규정 준수 비용을 증가시키며, 잠재적으로 혁신의 일부 측면을 지연시킬 가능성이 있습니다. 그러나 그들은 또한 더 큰 책임감과 투명성을 추구하여 궁극적으로 더 책임감 있고 지속 가능한 AI 개발로 이어질 수 있습니다.
주변의 우려가 커지면서 AI의 편견특히 자연어 처리 및 컴퓨터 비전과 같은 민감한 영역에서 AI 모델을 훈련하는 데 사용되는 데이터 세트가 윤리적으로 제공되고 편견이 없는지 확인하기 위해 Appen은 어떻게 작동합니까?
우리는 프로젝트 전반에 걸쳐 다양성과 포용성을 조성하여 편견을 줄이기 위해 적극적으로 노력하고 있습니다. 많은 고객이 데이터 수집 및 모델 평가 작업에서 광범위한 인구통계를 포착하는 데 집중하고 있다는 점은 고무적입니다. 대부분의 국가에 거주하는 글로벌 군중을 보유하면 광범위한 관점과 경험에서 데이터를 얻을 수 있으며, 이는 자연어 처리 및 컴퓨터 비전과 같은 민감한 영역에서 특히 중요합니다.
2019년부터 우리는 모범 사례를 군중 윤리 강령, 다양성, 공정성, 군중 복지에 대한 우리의 헌신을 보여줍니다. 여기에는 공정한 급여에 대한 약속, 군중의 목소리를 듣도록 보장하고 엄격한 개인 정보 보호를 유지하는 것이 포함됩니다. 이러한 원칙을 유지함으로써 우리는 책임 있는 AI 개발을 지원하는 고품질의 윤리적인 데이터를 제공하는 것을 목표로 합니다.
AI가 자동차, 광고, AR/VR과 같은 산업에 더욱 통합됨에 따라 Appen은 이러한 분야에서 증가하는 전문 교육 데이터에 대한 수요를 충족하기 위해 어떻게 자리매김하고 있습니까?
지난 27년 동안 우리는 다양한 산업과 사용 사례에 대한 전문 교육 데이터를 제공해 왔으며 고객의 요구 사항이 발전함에 따라 계속 발전하고 있습니다.
예를 들어, 자동차 분야에서 우리는 선도적인 자동차 회사 및 객실 내 솔루션 제공업체와 협력하여 차량 내 음성 시스템을 구축했습니다. 이제 우리는 운전자의 주의를 산만하게 하는 것을 모니터링하여 안전에 도움이 되는 운전자의 비디오 데이터 수집과 같은 새로운 영역에서 고객을 돕고 있습니다.
광고 분야에서 우리는 선도적인 글로벌 광고 플랫폼이 700만 건 이상의 평가를 통해 다년간 대규모 글로벌 프로그램을 통해 사용자 관련성에 대한 광고의 품질과 정확성을 향상하도록 도왔습니다. 이제 많은 플랫폼이 생성 AI 솔루션을 채택하고 있기 때문에 우리 군중은 광고의 관련성을 평가할 뿐만 아니라 생성된 광고의 품질을 평가하는 데도 도움을 주고 있습니다.
우리는 복잡한 작업 흐름과 텍스트, 오디오, 이미지, 비디오 및 다중 모드 주석을 포함한 다양한 데이터 형식을 지원하도록 사용자 정의할 수 있는 강력한 주석 플랫폼을 통해 이 모든 것을 수행할 수 있었습니다. 그러나 궁극적으로 변화하는 업계와 함께 움직일 수 있는 우리의 능력은 AI 개발을 위한 데이터에 대한 심층적인 전문 지식과 고객과의 강력한 파트너십으로 귀결됩니다.
Appen은 다양한 AI 애플리케이션을 위한 고품질 데이터를 제공하는 선두주자입니다. 앞으로 생성 AI와 LLM이 계속해서 글로벌 시장을 개발하고 영향을 미치면서 Appen의 역할이 어떻게 진화할 것으로 보시나요?
생성적 AI와 LLM은 산업을 변화시키고 있으며, 우리는 이러한 발전을 지원하기 위해 고품질 데이터를 제공하는 데 계속해서 중요한 역할을 할 것입니다. 글로벌 시장에서는 200개 국가와 500개 이상의 언어를 소싱할 수 있는 능력이 더욱 중요해질 것이며, Microsoft와 같은 회사가 110개 이상의 언어에 대한 기계 번역 모델을 출시하도록 지원한 강력한 역사를 가지고 있습니다.
LLM 응용 프로그램의 배포가 증가함에 따라 다양한 글로벌 시장에서 언어 및 문화적 차이를 해결할 수 있는 현지화 기능을 포함하여 인간 최종 사용자와 협력하려는 수요가 증가하고 있습니다. 우리는 이러한 모델을 교육하는 데 사용되는 데이터가 다양하고 관련성이 높으며 윤리적으로 제공되도록 보장하여 기업이 성능이 뛰어나고 책임감 있는 AI 시스템을 개발할 수 있도록 돕기 위해 최선을 다하고 있습니다.
Appen은 세계에서 가장 발전된 LLM을 지원하는 것으로 유명합니다. Appen이 이러한 모델의 성능을 향상시키기 위해 중점을 두고 있는 데이터 주석 및 수집의 혁신에는 어떤 것이 있습니까?
우리는 LLM의 성능을 향상시키기 위해 데이터 주석 및 수집 프로세스를 지속적으로 혁신하고 있습니다. 초점 영역 중 하나는 고품질 표준을 유지하면서 프로세스의 일부를 간소화하고 자동화하는 데 도움이 되는 고급 AI 지원 도구를 통해 데이터 주석의 효율성과 정확성을 향상시키는 것입니다.
사람의 추가 입력이 필요한 데이터 포인트를 식별하여 가장 큰 영향을 미칠 수 있는 곳에 주석 작업을 집중할 수 있습니다. 우리는 데이터 생산을 가속화하고 데이터 품질을 향상시키는 데 사용할 수 있는 Model Mate와 같은 기능을 플랫폼에 통합했습니다. 우리는 또한 작업의 복잡성이 증가함에 따라 중요한 기여자 관리의 모범 사례에 중점을 두고 있습니다.
기여자 수준의 성과를 이해하고 피드백을 제공하여 인간이 생성한 데이터의 품질을 지속적으로 개선하는 능력입니다. 이러한 혁신을 통해 우리는 세계 최고의 LLM을 지원하고 미세 조정하는 데 필요한 고품질의 대규모 데이터를 제공할 수 있습니다.
CEO로서 새로운 역할을 맡게 되면서 향후 몇 년 동안 Appen의 최우선 순위는 무엇이며 경쟁이 치열한 AI 분야에서 회사의 성장을 어떻게 추진할 계획입니까?
제가 CEO 역할로 전환하면서 저의 전략적 우선순위는 경쟁이 치열한 AI 환경에서 Appen의 리더십을 보장하도록 설계되었습니다.
- 생성적 AI 모델 개발 지원: 지난 18개월 동안 제너레이티브 AI는 당사 서비스 제공의 핵심 구성 요소가 되었습니다. 그룹 매출의 28%가 제너레이티브 AI 관련 프로젝트에서 발생했지만 2024년 6월에는 1월의 8%에서 발생했습니다. 업계 예측에 따르면 생성 AI 시장은 2032년까지 1조 3천억 달러에 이를 것으로 예상됩니다.
- 생성적 AI 모델 채택 지원: 기업이 사용 사례에 생성 AI 솔루션을 활용함에 따라 새로운 부문이 성장하는 것을 볼 수 있습니다. 비록 생성 AI 프로젝트가 배포에 도달하는 비율은 낮지만, FY24/25는 실험이 프로덕션으로 이동하고 맞춤형 고품질 및 전문 데이터에 대한 수요를 촉진하는 전환기가 될 것으로 예상합니다.
- 데이터 준비 방식 최적화 및 자동화: 품질 보증을 위해 AI를 활용하고 데이터 준비 프로세스의 특정 단계를 자동화합니다. 이를 통해 데이터 품질을 향상시키는 동시에 운영 효율성을 향상시켜 총 마진을 향상시킬 수 있습니다.
- 크라우드 작업자를 위한 경험 발전: 새로운 CrowdGen 플랫폼을 사용하면 자동화된 심사 및 프로젝트 매칭을 위해 AI를 활용하여 고객 요구 사항에 따라 프로젝트를 빠르고 유연하게 확장할 수 있습니다. 이는 또한 기여자의 개인화된 지원 경험을 향상시킬 것입니다. Appen은 데이터 소싱의 투명성, 다양성 및 공정성을 촉진하는 얼리 어답터였으며 Crowd 윤리 강령을 계속해서 준수하고 있습니다.
이러한 우선 순위는 Appen이 진화하는 AI 환경에서 지속적인 성장과 혁신을 이룰 수 있도록 자리매김할 것입니다.
훌륭한 인터뷰에 감사드리며, 더 많은 내용을 알고 싶은 독자들의 방문을 부탁드립니다. 앱.
게시물 Appen CEO Ryan Kolln – 인터뷰 시리즈 처음 등장한 Unite.AI.