Tamr의 CEO인 Anthony Deighton – 인터뷰 시리즈

antoine tardif

1년 ago

앤서니 데이튼 의 CEO입니다 다말. 그는 20년 동안 엔터프라이즈 소프트웨어 회사를 구축하고 확장한 경험이 있습니다. 가장 최근에는 Celonis에서 최고 마케팅 책임자로 2년을 보냈고, 프로세스 마이닝 소프트웨어 부문에서 리더십을 확립하고 수요 창출 프로그램을 만들어 130% ARR 성장을 이루었습니다. 그 전에는 Qlik에서 10년 이상 근무하면서 알려지지 않은 스웨덴 소프트웨어 회사에서 상장 기업으로 성장시켰습니다. 제품 리더십, 제품 마케팅, 마지막으로 CTO 역할을 맡았습니다. 그는 Siebel Systems에서 경력을 시작하여 다양한 제품 역할에서 엔터프라이즈 소프트웨어 회사를 구축하는 방법을 배웠습니다.

기업 소프트웨어 업계에서의 여정, 특히 Qlik과 Celonis에서 근무한 동안의 주요 이정표를 공유해 주시겠습니까?

저는 Siebel Systems에서 엔터프라이즈 소프트웨어 분야에서 경력을 시작했고, 그곳의 리더십 팀에서 엔터프라이즈 소프트웨어 회사를 구축하고 확장하는 방법에 대해 많은 것을 배웠습니다. 제가 Qlik에 합류했을 때 Qlik은 스웨덴 룬드에 위치한 60명의 소규모 팀의 95%를 보유한 작고 알려지지 않은 스웨덴 소프트웨어 회사였습니다. 저는 엔지니어나 영업 사원이 아니었기 때문에 마케팅을 담당하게 되었다고 농담을 합니다. 저는 그곳에서 마케팅 팀을 구성했지만, 시간이 지나면서 제 관심과 기여가 제품 관리로 옮겨갔고, 결국 최고 제품 책임자가 되었습니다. 우리는 2010년에 Qlik을 상장했고, 성공적인 상장 기업으로 계속 성장했습니다. 그 후, 우리는 인수를 하고 싶었기 때문에 M&A 팀을 시작했습니다. 상장 기업으로서 길고 어느 정도 성공적인 운영을 한 후, 결국 Qlik을 Thoma Bravo라는 사모펀드에 매각했습니다. 제가 말하듯이, 그것은 엔터프라이즈 소프트웨어 회사의 전체 수명 주기였습니다. Qlik을 떠난 후, 저는 미국에서 판매에 성공하고자 하는 소규모 독일 소프트웨어 회사인 Celonis에 합류했습니다. 다시 말하지만, 저는 CMO로서 마케팅을 담당했습니다. 우리는 매우 빠르게 성장했고 매우 성공적인 글로벌 마케팅 기능을 구축했습니다.

Celonis와 Qlik은 모두 데이터 분석 과제의 프런트 엔드에 집중했습니다. 즉, 데이터를 어떻게 보고 이해할 수 있을까요? Qlik의 경우 대시보드였고 Celonis의 경우 비즈니스 프로세스였습니다. 하지만 두 회사 모두 공통적으로 제기된 과제는 이러한 시각화의 기반이 되는 데이터였습니다. 많은 고객이 데이터가 잘못되었다고 불평했습니다. 중복된 레코드, 불완전한 레코드, 누락된 데이터 사일로가 있었습니다. 이것이 제가 Tamr에 끌린 이유인데, 처음으로 지저분한 엔터프라이즈 데이터의 과제를 해결할 수 있을 것 같았습니다. 엔터프라이즈 소프트웨어 경력의 처음 15년은 데이터를 시각화하는 데 보냈고, 앞으로 15년은 그 데이터를 정리하는 데 사용할 수 있기를 바랍니다.

초기 경험이 기업 소프트웨어 회사를 구축하고 확장하는 데 대한 접근 방식에 어떤 영향을 미쳤나요?

Siebel에서 Qlik으로 전환하면서 제가 배운 중요한 교훈 중 하나는 단순함의 힘이었습니다. Siebel은 매우 강력한 소프트웨어였지만, 훨씬 적은 기능을 가진 CRM을 만든 Salesforce.com에 의해 시장에서 몰락했습니다(Siebel은 “장난감”이라고 불렀습니다). 하지만 SaaS 솔루션으로 제공되었기 때문에 고객은 빠르게 작동시킬 수 있었습니다. 오늘날에는 당연한 것처럼 보이지만, 당시에는 고객이 기능을 구매하는 것이 지혜로웠지만, 우리가 배운 것은 고객이 비즈니스 문제를 해결하기 위한 솔루션에 투자한다는 것입니다. 따라서 소프트웨어가 문제를 더 빨리 해결한다면, 당신이 이깁니다. Qlik은 데이터 분석 문제에 대한 간단한 솔루션이었지만, 훨씬 더 간단했습니다. 그 결과, Business Objects와 Cognos와 같은 기능이 더 풍부한 경쟁사를 이길 수 있었습니다.

두 번째로 중요한 교훈은 마케팅에서 제품으로의 경력 전환에서 배웠습니다. 우리는 이러한 도메인을 별개로 생각합니다. 저는 제 경력에서 제품과 마케팅 사이를 유연하게 오가는 것을 발견했습니다. 어떤 제품을 만드는지와 잠재 고객에게 어떻게 설명하는지 사이에는 밀접한 관련이 있습니다. 그리고 잠재 고객이 요구하는 것과 우리가 만들어야 할 제품 사이에도 똑같이 중요한 관련이 있습니다. 이러한 대화 사이를 오가는 능력은 모든 엔터프라이즈 소프트웨어 회사의 중요한 성공 요인입니다. 스타트업이 실패하는 일반적인 이유는 “만들면 사람들이 올 것이다”고 믿는 것입니다. 이는 멋진 소프트웨어를 만들기만 하면 사람들이 줄을 서서 구매할 것이라는 일반적인 믿음입니다. 이것은 결코 효과가 없으며 솔루션은 소프트웨어 개발 프로세스와 연결된 강력한 마케팅 프로세스입니다.

제가 공유할 마지막 아이디어는 제 학업과 직업적 작업을 연결합니다. 저는 경영대학원에서 Clay Christensen의 파괴적 혁신 이론에 대한 수업을 들을 기회가 있었습니다. 직업적 작업에서 저는 파괴자가 되고 파괴되는 것을 모두 경험할 기회가 있었습니다. 제가 배운 중요한 교훈은 모든 파괴적 혁신은 불가능을 마침내 가능하게 만드는 외생적 플랫폼 전환의 결과라는 것입니다. Qlik의 경우 Qlik이 기존 큐브 기반 보고를 파괴할 수 있었던 것은 대용량 메모리 서버의 플랫폼 가용성 덕분이었습니다. Tamr에서는 대규모 머신 러닝의 플랫폼 가용성 덕분에 AI 기반 접근 방식을 선호하여 수동 규칙 기반 MDM을 파괴할 수 있습니다. 항상 어떤 플랫폼 전환이 파괴를 주도하는지 파악하는 것이 중요합니다.

AI 기반 마스터 데이터 관리(MDM)의 개발에 영감을 준 것은 무엇이며, 기존 MDM 솔루션과 어떻게 다릅니까?

Tamr의 개발은 MIT(매사추세츠 공과대학)에서 엔터티 해결을 중심으로 한 학술 연구로 이루어졌습니다. 튜링상 수상자 마이클 스톤브레이커의 학술적 리더십 하에, 팀이 조사한 질문은 “수십만 개의 소스와 수백만 개의 레코드에 걸쳐 데이터 레코드를 연결할 수 있을까?”였습니다. 표면적으로는, 레코드와 소스가 많을수록 각각의 가능한 매치를 비교해야 하는 레코드가 많아지기 때문에 극복할 수 없는 과제입니다. 컴퓨터 과학자들은 이를 “n제곱 문제”라고 부르는데, 이 문제는 규모에 따라 기하급수적으로 증가하기 때문입니다.

기존 MDM 시스템은 규칙과 방대한 양의 수동 데이터 큐레이션으로 이 문제를 해결하려고 합니다. 규칙은 모든 코너 케이스를 포괄할 만큼 충분한 규칙을 작성할 수 없고 수천 개의 규칙을 관리하는 것은 기술적으로 불가능하기 때문에 확장되지 않습니다. 수동 큐레이션은 수백만 개의 가능한 레코드와 비교를 처리하기 위해 인간에 의존하기 때문에 매우 비쌉니다. 이를 종합하면 기존 MDM(마스터 데이터 관리) 솔루션의 시장 채택이 저조한 이유를 설명합니다. 솔직히 말해서, 아무도 기존 MDM을 좋아하지 않습니다.

Tamr의 간단한 아이디어는 AI가 소스 수집, 레코드 매칭, 값 해결 작업을 수행하도록 훈련하는 것이었습니다. AI의 장점은 먹고, 자고, 휴가를 가지 않는다는 것입니다. 또한 매우 병렬화 가능하여 방대한 양의 데이터를 처리하고 더 나은 방향으로 발전시킬 수 있습니다. 따라서 MDM이 불가능했던 곳에서 마침내 정리되고 통합된 최신 데이터를 얻을 수 있습니다(위 참조).

기업들이 데이터 관리에서 직면하는 가장 큰 과제는 무엇이며, Tamr은 이러한 문제를 어떻게 해결합니까?

첫 번째이자, 아마도 가장 중요한 과제로 여겨지는 데이터 관리에서 기업이 직면한 과제는 비즈니스 사용자가 생성한 데이터를 사용하지 않는다는 것입니다. 다시 말해, 데이터 팀이 조직에서 분석 질문에 답하거나 비즈니스 프로세스를 간소화하는 데 사용하는 고품질 데이터를 생성하지 않는다면 시간과 비용을 낭비하는 것입니다. Tamr의 주요 출력은 모든 기본 1차 및 3차 데이터를 결합하여 비즈니스 사용자가 데이터를 보고 피드백을 제공할 수 있도록 하는 모든 엔터티 레코드(예: 고객, 제품, 부품 등)에 대한 360페이지입니다. 엔터티 데이터에 대한 위키와 같습니다. 이 360페이지는 비즈니스 사용자가 데이터로 질문하고 답할 수 있는 대화형 인터페이스에 대한 입력이기도 합니다. 따라서 첫 번째 작업은 사용자에게 데이터를 제공하는 것입니다.

기업이 사용자에게 좋아하는 데이터를 제공하기 어려운 이유는 무엇일까요? 그 목표의 근저에는 세 가지 주요 어려운 문제가 있기 때문입니다. 새 소스 로드, 새 레코드를 기존 데이터에 매칭, 데이터의 값/필드 수정입니다. Tamr은 AI가 새 필드를 정의된 엔터티 스키마에 자동으로 매핑하기 때문에 새 데이터 소스를 쉽게 로드할 수 있습니다. 즉, 새 데이터 소스가 특정 필드를 무엇이라고 부르든(예: cust_name) 해당 엔터티의 올바른 중앙 정의(예: “고객 이름”)에 매핑됩니다. 다음 과제는 중복된 레코드를 연결하는 것입니다. 이 맥락에서 중복은 레코드가 실제로 동일한 실제 엔터티라는 것을 의미합니다. Tamr의 AI는 이를 수행하고 심지어 외부 타사 소스를 “기본 진실”로 사용하여 회사 및 사람과 같은 공통 엔터티를 해결합니다. 이에 대한 좋은 예는 “Dell Computer”와 같은 중요한 고객에 대한 여러 소스의 모든 레코드를 연결하는 것입니다. 마지막으로, 주어진 레코드에 대해 비어 있거나 잘못된 필드가 있을 수 있습니다. Tamr은 내부 및 타사 소스에서 올바른 필드 값을 입력할 수 있습니다.

Tamr가 회사의 데이터 관리와 사업 성과를 크게 개선한 성공 사례를 공유해 주실 수 있나요?

CHG Healthcare는 의료 인력 공급 산업의 주요 업체로, 숙련된 의료 전문가를 필요한 시설과 연결합니다. Locums를 통한 임시 의사, RNnetwork를 통한 간호사 또는 CHG 자체를 통한 더 광범위한 솔루션이든, 의료 시설이 원활하게 운영되고 환자에게 양질의 치료를 제공할 수 있도록 맞춤형 인력 공급 솔루션을 제공합니다.

그들의 근본적인 가치 제안은 적절한 시기에 적절한 의료 서비스 제공자를 적절한 시설에 연결하는 것입니다. 그들의 과제는 네트워크의 모든 제공자에 대한 정확하고 통합된 관점이 없다는 것이었습니다. 그들의 규모(750만 명 이상의 제공자)를 감안할 때, 인간 큐레이터에 대한 은행을 털지 않고는 기존의 규칙 중심적 접근 방식으로 데이터를 정확하게 유지하는 것은 불가능했습니다. 그들은 또한 그들의 인력 결정이 그것에 달려 있었기 때문에 문제를 무시할 수 없었습니다. 그들에게 나쁜 데이터는 제공자가 처리할 수 있는 것보다 더 많은 교대 근무를 받게 되어 번아웃으로 이어질 수 있음을 의미할 수 있습니다.

Tamr의 고급 AI/ML 기능을 사용하여 CHG Healthcare는 중복된 의사 기록을 45% 줄였고, 희소한 데이터 및 분석 리소스가 수행하던 수동 데이터 준비를 거의 완전히 없앴습니다. 그리고 가장 중요한 것은 CHG가 공급자에 대한 신뢰할 수 있고 정확한 뷰를 확보함으로써 인력을 최적화하여 더 나은 고객 경험을 제공할 수 있다는 것입니다.

데이터 관리 분야에서 AI에 대한 흔한 오해는 무엇이며, Tamr은 이런 오해를 어떻게 해소하는 데 도움이 되나요?

일반적인 오해는 AI가 “완벽해야” 한다는 것, 또는 규칙과 인간의 큐레이션이 AI와 대조적으로 완벽하다는 것입니다. 현실은 규칙이 항상 실패한다는 것입니다. 그리고 더 중요한 것은 규칙이 실패할 때 유일한 해결책은 더 많은 규칙입니다. 따라서 관리할 수 없는 규칙의 혼란이 생깁니다. 그리고 인간의 큐레이션도 오류가 있습니다. 인간은 좋은 의도를 가질 수 있지만(항상은 아니지만) 항상 옳은 것은 아닙니다. 더 나쁜 것은 일부 인간 큐레이터가 다른 큐레이터보다 뛰어나거나 단순히 다른 큐레이터와 다른 결정을 내릴 수 있다는 것입니다. 반면에 AI는 본질적으로 확률적입니다. 우리는 통계를 통해 이러한 기술이 얼마나 정확한지 검증할 수 있으며, 그렇게 하면 AI가 경쟁 대안보다 비용이 적게 들고 더 정확하다는 것을 알게 됩니다.

Tamr는 데이터 정확성을 위해 AI와 인간의 정제를 결합합니다. 이 조합이 실제로 어떻게 작동하는지 자세히 설명해 주시겠습니까?

인간은 AI에게 매우 중요한 것을 제공합니다. 바로 훈련을 제공하는 것입니다. AI는 실제로 인간의 노력을 확장하는 것입니다. Tamr이 인간에게 기대하는 것은 기계가 모델 매개변수를 설정하는 데 사용할 수 있는 소수의 예(“훈련 레이블”)입니다. 실제로 이는 인간이 데이터와 함께 약간의 시간을 보내 Tamr에게 데이터의 오류와 실수에 대한 예를 제공하고 AI가 전체 데이터 세트에서 이러한 수업을 실행하는 방식입니다. 또한 새로운 데이터가 추가되거나 데이터가 변경되면 AI는 자신 있게 결정을 내리는 데 어려움을 겪는 인스턴스(“낮은 신뢰도 일치”)를 표면화하고 인간에게 입력을 요청할 수 있습니다. 물론 이 입력은 모델을 개선하고 업데이트하는 데 사용됩니다.

대규모 언어 모델(LLM)은 Tamr의 데이터 품질 및 강화 프로세스에서 어떤 역할을 합니까?

첫째, LLM이 무엇에 능숙한지 명확히 하는 것이 중요합니다. 근본적으로 LLM은 언어에 관한 것입니다. LLM은 무언가를 의미하는 텍스트 문자열을 생성하고, 전달된 텍스트의 의미를 “이해”할 수 있습니다. 따라서 LLM을 언어 기계라고 할 수 있습니다. 따라서 언어가 중요한 Tamr의 경우 LLM을 사용합니다. 분명한 예 중 하나는 가상 CDO라고 애정을 담아 부르는 엔티티 데이터 위에 있는 대화형 인터페이스입니다. 실제 CDO와 대화하면 그들은 당신을 이해하고 당신이 이해하는 언어로 응답합니다. 이것은 바로 우리가 LLM에서 기대하는 바이며, 바로 그것이 우리 소프트웨어의 그 부분에서 사용하는 방식입니다. 이 맥락에서 Tamr의 가치 있는 점은 우리가 엔터티 데이터를 vCDO와의 대화에 대한 맥락으로 사용한다는 것입니다. 마치 실제 CDO가 질문에 응답할 때 모든 최고의 엔터프라이즈 데이터를 손끝에서 사용할 수 있는 것과 같습니다. 대단하지 않나요!

또한 데이터 값을 정리하거나 누락된 값을 입력할 때 입력 값의 언어 기반 해석을 사용하여 누락된 값을 찾거나 수정하려는 경우가 있습니다. 예를 들어, 텍스트 “5mm 볼 베어링”에서 부품의 크기를 묻는 경우 LLM(또는 사람)은 “5mm”라고 올바르게 대답할 것입니다.

마지막으로, 기본 LLM은 언어 의미를 토큰(단어 생각하기)에 인코딩하는 임베딩 모델입니다. 이는 언어적 비교를 계산하는 데 매우 유용할 수 있습니다. 따라서 “5”와 “five”는 공통된 문자가 없지만 언어적 의미는 매우 가깝습니다. 따라서 이 정보를 사용하여 레코드를 서로 연결할 수 있습니다.

특히 AI와 머신 러닝의 발전으로 인해 데이터 관리의 미래가 어떻게 발전할 것으로 생각하시나요?

2000년대 초반의 “빅 데이터” 시대는 “소규모 데이터” 시대로 기억되어야 합니다. 지난 20년 이상 동안 스토리지와 컴퓨팅의 상품화로 인해 많은 데이터가 생성되었지만, 기업에 영향을 미친 대부분의 데이터는 비교적 규모가 작습니다. 기본 판매 및 고객 보고서, 마케팅 분석 및 대시보드에 쉽게 표현할 수 있는 기타 데이터 세트입니다. 결과적으로 데이터 관리에 사용되는 많은 도구와 프로세스가 ‘소규모 데이터’에 최적화되어 있으며, 이것이 인간의 큐레이션으로 보완된 규칙 기반 논리가 여전히 데이터 관리에서 두드러지는 이유입니다.

사람들이 데이터를 사용하고자 하는 방식은 AI와 머신 러닝의 발전으로 근본적으로 변화하고 있습니다. 사람의 업무의 상당 부분을 자율적으로 수행할 수 있는 “AI 에이전트”라는 아이디어는 에이전트가 필요한 데이터를 가지고 있는 경우에만 작동합니다. AI 에이전트가 고객 지원의 최전선에서 일하기를 기대하지만 CRM에 “Dell Computer”의 표현이 5개 있고 ERP의 제품 정보와 연결되어 있지 않다면 Dell의 누군가가 연락했을 때 어떻게 고품질 서비스를 제공할 수 있다고 기대할 수 있습니까?

이것의 의미는 우리의 데이터 관리 툴링과 프로세스가 규모를 처리하기 위해 진화해야 한다는 것인데, 이는 AI와 머신 러닝을 도입하여 더 많은 데이터 정리 활동을 자동화해야 한다는 것을 의미합니다. 인간은 여전히 프로세스를 감독하는 데 큰 역할을 하겠지만 근본적으로 우리는 기계에 더 많은 작업을 요청하여 단일 대시보드의 데이터만이 정확하고 완전한 것이 아니라 기업의 대부분 데이터가 되도록 해야 합니다.

오늘날 기업이 데이터를 보다 효과적으로 활용할 수 있는 가장 큰 기회는 무엇일까요?

사람들이 데이터를 소비할 수 있는 방법의 수 증가. 데이터 시각화 도구의 개선으로 기업 전체에서 데이터에 훨씬 더 쉽게 접근할 수 있게 되었다는 것은 의심의 여지가 없습니다. 이제 데이터 및 분석 리더는 대시보드를 넘어 데이터로 가치를 제공하는 방법을 찾아야 합니다. 내부 360페이지, 지식 그래프, 대화형 도우미와 같은 인터페이스는 새로운 기술로 가능해지고 있으며, 잠재적인 데이터 소비자에게 일상 업무 흐름에서 데이터를 사용할 수 있는 더 많은 방법을 제공합니다. CRM 및 ERP와 같이 사람들이 이미 사용하는 시스템에 이러한 인터페이스가 내장되어 있을 때 특히 강력합니다. 데이터에서 더 많은 가치를 창출하는 가장 빠른 방법은 데이터를 사용할 수 있는 사람들에게 데이터를 제공하는 것입니다.

훌륭한 인터뷰에 감사드립니다. 더 자세히 알고 싶은 독자는 다음을 방문하세요. 다말.

게시물 Tamr의 CEO인 Anthony Deighton – 인터뷰 시리즈 처음 등장 유나이트.AI.

관련된 글: