Eric Landau는 CEO 겸 공동 창립자입니다. 엔코드컴퓨터 비전을 위한 능동 학습 플랫폼. Eric은 글로벌 주식 델타-원 데스크에서 수석 양적 연구원으로, 수천 개의 모델을 생산에 투입했습니다. Encord 이전에 그는 DRW에서 거의 10년 동안 고빈도 거래를 했습니다. 그는 하버드 대학교에서 응용 물리학 석사 학위, 전기 공학 석사 학위, 스탠포드 대학교에서 물리학 학사 학위를 취득했습니다.
에릭은 여가 시간에는 ChatGPT와 대규모 언어 모델을 사용하고 칵테일을 만드는 것을 좋아합니다.
무엇이 Encord를 공동 창립하게 된 영감이었고, 입자 물리학과 양적 금융 분야의 경험이 AI의 “데이터 문제”를 해결하는 접근 방식에 어떤 영향을 미쳤나요?
저는 스탠포드 선형 가속기 센터(SLAC)에서 입자 물리학을 연구하고 매우 큰 데이터 세트를 다루는 동안 머신 러닝에 대해 처음 생각하기 시작했습니다. 저는 물리학자가 물리학자를 위해 디자인한 소프트웨어를 사용했는데, 즉 즐거운 사용자 경험 측면에서 바라는 것이 많았습니다. 더 쉬운 도구가 있었다면 훨씬 더 빨리 분석을 실행할 수 있었을 것입니다.
나중에 DRW에서 양적 금융을 담당하면서, 저는 프로덕션에 배포된 수천 개의 모델을 만드는 일을 맡았습니다. 물리학에서의 경험과 마찬가지로, 저는 정확한 모델을 만드는 데 고품질 데이터가 중요하고 복잡하고 대규모 데이터를 관리하는 것이 어렵다는 것을 알게 되었습니다. Ulrik은 컴퓨터 비전을 위해 대규모 이미지 데이터 세트를 시각화하는 비슷한 경험을 했습니다.
Encord에 대한 그의 초기 아이디어에 대해 들었을 때, 저는 즉시 참여했고 그 중요성을 이해했습니다. Ulrik과 저는 함께 AI 데이터 개발 프로세스를 자동화하고 간소화하는 플랫폼을 구축할 수 있는 엄청난 기회를 보았고, 이를 통해 팀이 최상의 데이터를 모델에 더 쉽게 도입하고 신뢰할 수 있는 AI 시스템을 구축할 수 있게 되었습니다.
Encord의 비전에 대해 자세히 설명해 주시겠습니까? 그리고 잠재력과 과제 측면에서 초기 컴퓨팅이나 인터넷과 비교했을 때 Encord가 어떻게 다른지 설명해 주시겠습니까?
Encord의 비전은 기업이 데이터를 기능적 AI 모델로 변환하는 데 의존하는 기반 플랫폼이 되는 것입니다. 우리는 회사의 데이터와 AI 사이의 계층입니다.
여러 면에서 AI는 개인 컴퓨팅 및 인터넷과 같은 이전 패러다임 변화를 반영하여 모든 개인, 기업, 국가 및 산업의 워크플로에 필수적이 될 것입니다. 이전의 기술 혁명과는 달리, 대체로 병목 현상이 발생했습니다. 무어의 법칙 10년마다 30배의 복합 계산 성장으로 AI 개발은 동시 혁신의 혜택을 입었습니다. 따라서 훨씬 더 빠른 속도로 움직이고 있습니다. NVIDIA의 젠슨 황의 말에 따르면 “처음으로 우리는 복합 지수를 보고 있습니다… 우리는 10년마다 백만 배씩 복리되고 있습니다. 백 배도 아니고, 천 배도 아니고, 백만 배입니다.” 과장 없이, 우리는 인류 역사상 가장 빠르게 움직이는 기술을 목격하고 있습니다.
여기서의 잠재력은 엄청납니다. AI를 위한 고품질 데이터 관리를 자동화하고 확장함으로써, 우리는 더 광범위한 AI 도입을 방해하는 병목 현상을 해결하고 있습니다. 이러한 과제는 이전 기술 시대의 초기 장애물과 유사합니다. 사일로, 모범 사례 부족, 비기술적 사용자에 대한 제한, 잘 정의된 추상화 부족.
Encord Index는 AI 데이터를 관리하고 큐레이팅하는 핵심 도구로 자리매김했습니다. 현재 이용 가능한 다른 데이터 관리 플랫폼과 어떻게 차별화됩니까?
Encord Index가 돋보이는 몇 가지 방법은 다음과 같습니다.
인덱스는 확장 가능합니다: 사용자가 수백만 개가 아닌 수십억 개의 데이터 포인트를 관리할 수 있도록 합니다. 다른 도구는 구조화되지 않은 데이터에 대한 확장성 문제에 직면하고 조직의 모든 관련 데이터를 통합하는 데 제한이 있습니다.
인덱스는 유연합니다: AWS, GCP, Azure와 같은 개인 데이터 저장소 및 클라우드 저장소 공급업체와 직접 통합합니다. 단일 클라우드 공급업체나 내부 저장소 시스템에 국한된 다른 도구와 달리 Index는 데이터가 있는 위치에 구애받지 않습니다. 적절한 거버넌스와 액세스 제어를 통해 여러 소스의 데이터를 관리하여 안전하고 규정을 준수하는 AI 애플리케이션을 개발할 수 있습니다.
인덱스는 멀티모달입니다: 이미지, 비디오, 오디오, 텍스트, 문서 등의 형태로 데이터를 관리하는 멀티모달 AI를 지원합니다. Index는 오늘날 많은 LLM 도구와 같이 단일 형태의 데이터에 국한되지 않습니다. 인간의 인지는 멀티모달이며, 멀티모달 AI가 채팅봇과 LLM을 대체할 차세대 AI 발전의 핵심이 될 것이라고 믿습니다.
Encord Index는 AI 모델에 적합한 데이터를 선택하는 과정을 어떤 방식으로 개선하며, 이는 모델 성능에 어떤 영향을 미칩니까?
Encord Index는 대규모 데이터세트의 큐레이션을 자동화하여 데이터 선택을 개선하고, 팀이 가장 관련성 있는 데이터만 식별하고 보관하는 동시에 정보가 없거나 편향된 데이터를 제거하는 데 도움을 줍니다. 이 프로세스는 데이터세트의 크기를 줄일 뿐만 아니라 AI 모델을 훈련하는 데 사용되는 데이터의 품질을 크게 개선합니다. 당사 고객은 모델에서 최대 20%의 개선을 경험했으며, 데이터세트 크기를 35% 줄이고 컴퓨팅 및 인적 주석 비용을 수십만 달러 절감했습니다.
Meta의 Segment Anything Model과 같은 최첨단 기술의 빠른 통합으로, Encord는 빠르게 진화하는 AI 분야에서 어떻게 앞서 나갈 수 있을까요?
우리는 의도적으로 새로운 기술에 빠르게 적응할 수 있도록 플랫폼을 구축했습니다. 우리는 SAM과 같은 발전을 쉽게 통합하는 확장 가능한 소프트웨어 우선 접근 방식을 제공하는 데 중점을 두고, 사용자가 항상 경쟁력을 유지하기 위한 최신 도구를 갖추고 있도록 합니다.
우리는 멀티모달 AI에 집중하여 앞서 나갈 계획입니다. Encord 플랫폼은 이미 이미지, 비디오, 텍스트와 같은 복잡한 데이터 유형을 관리할 수 있으므로 멀티모달 AI가 더 발전함에 따라 우리는 준비가 되었습니다.
기업이 AI 데이터를 관리할 때 직면하는 가장 일반적인 과제는 무엇이며, Encord는 이러한 문제를 해결하는 데 어떻게 도움이 되나요?
기업이 직면하는 주요 과제는 3가지입니다.
- 데이터 구성 및 제어가 부족합니다.: 기업이 AI 솔루션을 구현할 준비를 할 때 종종 AI에 적합하지 않은 사일로화되고 체계화되지 않은 데이터의 현실에 직면하게 됩니다. 이러한 데이터는 종종 강력한 거버넌스가 부족하여 AI 시스템에서 많은 데이터가 사용되는 데 제한을 받습니다.
- 인간 전문가 부족: AI 모델이 점점 더 복잡한 문제를 해결함에 따라 곧 데이터를 준비하고 검증할 인간 도메인 전문가가 부족해질 것입니다. 회사의 AI 수요가 증가함에 따라 그 인력을 확장하는 것은 어렵고 비용이 많이 듭니다.
- 확장 불가능한 툴링: 성능이 뛰어난 AI 모델은 미세 조정, 검증, RAG 및 기타 워크플로에 필요한 데이터 측면에서 매우 많은 데이터를 필요로 합니다. 이전 세대의 도구는 오늘날의 프로덕션 등급 모델에 필요한 데이터 양과 데이터 유형을 관리할 수 있는 장비가 없습니다.
Encord는 대규모 데이터 큐레이션 프로세스를 자동화하여 이러한 문제를 해결하고, 문제가 있는 데이터에서 영향력 있는 데이터를 쉽게 식별하고 효과적인 교육 및 검증 데이터 세트를 생성하도록 합니다. 데이터 관리 요구 사항이 변경됨에 따라 쉽게 확장하거나 축소할 수 있는 소프트웨어 우선 접근 방식을 사용합니다. 당사의 AI 지원 주석 도구는 인간 참여 도메인 전문가가 워크플로 효율성을 극대화할 수 있도록 지원합니다. 이 프로세스는 AI 트레이너가 비용이 많이 드는 금융 서비스 및 의료와 같은 산업에서 특히 중요합니다. 당사는 조직의 모든 비정형 데이터를 쉽게 관리하고 이해할 수 있도록 하여 수동 노동의 필요성을 줄입니다.
Encord는 공정하고 균형 잡힌 AI 모델을 보장하기 위해 데이터 편향과 데이터 세트 내의 대표성이 낮은 영역의 문제를 어떻게 해결합니까?
데이터 편향을 해결하는 것은 Encord에서 우리에게 중요한 초점입니다. 저희 플랫폼은 데이터가 편향될 수 있는 영역을 자동으로 식별하고 표면화하여 AI 팀이 모델 성능에 영향을 미치기 전에 이러한 문제를 해결할 수 있도록 합니다. 또한 데이터 세트 내에서 대표성이 낮은 영역이 적절하게 포함되도록 보장하여 더 공정하고 균형 잡힌 AI 모델을 개발하는 데 도움이 됩니다. 저희의 큐레이션 도구를 사용하면 팀은 모델이 다양하고 대표적인 데이터에서 훈련되었다는 확신을 가질 수 있습니다.
Encord는 최근 시리즈 B 펀딩에서 3,000만 달러를 확보했습니다. 이 펀딩은 어떻게 귀사의 제품 로드맵과 확장 계획을 가속화할 것인가요?
시리즈 B 펀딩의 3,000만 달러는 향후 6개월 동안 제품, 엔지니어링 및 AI 연구팀의 규모를 크게 늘리고 Encord Index 및 기타 새로운 기능의 개발을 가속화하는 데 사용될 예정입니다. 또한 샌프란시스코에 새로운 사무실을 열어 입지를 확대하고 있으며, 이 펀딩은 성장하는 고객 기반을 지원하기 위해 운영을 확장하는 데 도움이 될 것입니다.
Y Combinator에서 시리즈 B 투자를 유치한 가장 젊은 AI 기업인 Encord의 급속한 성장과 성공의 비결은 무엇이라고 생각하시나요?
우리가 빠르게 성장할 수 있었던 이유 중 하나는 회사의 모든 영역에서 극도로 고객 중심적인 초점을 채택했기 때문입니다. 우리는 고객과 끊임없이 소통하고, 고객의 문제에 귀를 기울이고, 솔루션을 찾기 위해 “곰 포옹”합니다. 과장된 광고보다는 고객 요구 사항에 집중함으로써 다양한 산업의 최고 AI 팀과 공감하는 플랫폼을 만들었습니다. 고객은 우리가 오늘날의 위치에 도달하는 데 중요한 역할을 했습니다. AI 데이터의 복잡성을 빠르고 효과적으로 관리할 수 있는 우리의 능력은 우리를 기업에 매력적인 솔루션으로 만들었습니다.
또한 우리는 Encord를 옹호하기 위해 끊임없이 노력한 팀원, 파트너, 투자자에게 많은 성공을 빚지고 있습니다. 세계적 수준의 제품, 엔지니어링, 시장 진출 팀과 협력한 것은 우리의 성장에 엄청난 영향을 미쳤습니다.
AI에서 데이터의 중요성이 커짐에 따라, Encord와 같은 AI 데이터 플랫폼의 역할이 향후 5년 동안 어떻게 발전할 것으로 보십니까?
AI 애플리케이션이 복잡해짐에 따라 효율적이고 확장 가능한 데이터 관리 솔루션에 대한 필요성은 증가할 뿐입니다. 저는 모든 기업이 결국 AI 부서를 갖게 될 것이라고 믿습니다. 오늘날 IT 부서가 존재하는 방식과 매우 유사합니다. Encord는 AI에 필요한 방대한 양의 데이터를 관리하고 모델을 신속하게 프로덕션에 적용하는 데 필요한 유일한 플랫폼이 될 것입니다.
훌륭한 인터뷰에 감사드립니다. 더 자세히 알고 싶은 독자는 다음을 방문하세요. 엔코드.
게시물 Encord의 공동 창립자 겸 CEO인 Eric Landau – 인터뷰 시리즈 처음 등장 유나이트.AI.