마이크 플렉스먼 박사 현재 HEAVY.AI의 제품 담당 부사장이며, 이전에는 제품 관리자로 근무했고 전문 서비스에서 공간 데이터 과학 실무를 이끌었습니다. 그는 지난 20년 동안 공간 환경 계획 분야에서 일했습니다. HEAVY.AI 이전에는 공간 분석 기술을 계획에 적용하는 두 개의 스타트업인 Geodesign Technolgoies, Inc를 설립하고 GeoAdaptive LLC를 공동 설립했습니다. 스타트업에 들어가기 전에는 MIT의 계획 교수와 ESRI의 산업 관리자였습니다.
헤비.AI 실시간, 고충격 데이터 분석을 위한 하드웨어 가속 플랫폼입니다. GPU와 CPU 처리를 모두 활용하여 SQL 및 지리공간 데이터를 지원하여 방대한 데이터 세트를 빠르게 쿼리합니다. 이 플랫폼에는 대화형 대시보드, 교차 필터링 및 확장 가능한 데이터 시각화를 위한 시각적 분석 도구가 포함되어 있어 다양한 산업에서 효율적인 빅데이터 분석을 가능하게 합니다.
귀하의 전문적 배경과 HEAVY.AI에 합류하게 된 계기가 무엇인지 말씀해 주시겠습니까?
HEAVY.AI에 합류하기 전에 저는 학계에서 수년간 일했고, 궁극적으로 MIT에서 공간 분석을 가르쳤습니다. 또한 다양한 공공 부문 고객을 대상으로 소규모 컨설팅 회사를 운영했습니다. 저는 17개국에서 GIS 프로젝트에 참여했습니다. 제 업무는 Inter American Development Bank와 같은 조직에 자문을 제공하는 것에서 세계 최대의 GIS 개발업체인 ESRI에서 건축, 엔지니어링 및 건설을 위한 GIS 기술을 관리하는 것으로 이어졌습니다.
저는 지금의 HEAVY.AI와 처음 만났을 때를 생생히 기억합니다. 당시 저는 컨설턴트로서 플로리다 해변 서식지 보호 프로그램의 시나리오 계획을 담당하고 있었습니다. 제 동료들과 저는 30m Landsat 데이터를 사용하여 바다거북 서식지를 모델링하는 데 어려움을 겪고 있었고, 친구가 저에게 아주 새롭고 매우 관련성 있는 데이터인 5cm LiDAR를 알려주었습니다. 그것은 과학적으로 정확히 필요한 것이었지만, 우리가 사용할 계획이었던 것보다 약 3600배 더 컸습니다. 말할 것도 없이, 아무도 그 금액의 일부라도 제 예산을 늘리려 하지 않았습니다. 그래서 그날 저는 수십 년 동안 사용하고 가르쳐 온 도구를 내려놓고 새로운 것을 찾기 시작했습니다. HEAVY.AI는 그 데이터를 너무나 매끄럽고 쉽게 잘라내고 렌더링했기 때문에 저는 즉시 매료되었습니다.
몇 년이 흘렀지만, 저는 여전히 HEAVY.AI가 하는 일이 매우 독특하다고 생각하고 GPU 분석에 대한 초기 투자는 업계가 여전히 가야 할 방향이라고 생각합니다. HEAVY.AI는 빅데이터에 대한 접근성을 민주화하는 데 확고히 집중하고 있습니다. 여기에는 물론 데이터 볼륨과 처리 속도 구성 요소가 있어 본질적으로 모든 사람에게 자체 슈퍼컴퓨터를 제공합니다. 그러나 대규모 언어 모델의 출현으로 점점 더 중요해지는 측면은 더 많은 사람들이 공간 모델링을 사용할 수 있도록 하는 것입니다. 요즘에는 수천 개의 도구가 있는 복잡한 인터페이스를 배우는 데 몇 년을 보내는 대신, 원하는 인간 언어로 HEAVY.AI와 대화를 시작할 수 있습니다. 이 프로그램은 필요한 명령을 생성할 뿐만 아니라 관련 시각화도 제공합니다.
비하인드 스토리에서 사용 편의성을 제공하는 것은 물론 매우 어렵습니다. 현재 HEAVY.AI의 제품 관리 부사장으로서 저는 제품에 어떤 기능과 역량을 우선시할지 결정하는 데 크게 관여하고 있습니다. GIS 분야에서의 광범위한 배경 덕분에 고객의 요구 사항을 진정으로 이해하고 그에 따라 개발 로드맵을 안내할 수 있습니다.
공간 환경 계획과 스타트업 분야에서의 이전 경험이 HEAVY.AI에서의 업무에 어떤 영향을 미쳤나요?
환경 계획은 인간의 다양한 요구와 자연 세계를 모두 고려해야 하기 때문에 특히 어려운 분야입니다. 제가 일찍 배운 일반적인 해결책은 참여 계획이라고 알려진 방법을 원격 감지 및 GIS 기술과 결합하는 것이었습니다. 행동 계획을 세우기 전에 여러 시나리오를 만들고 시각화를 사용하여 컴퓨터에서 긍정적, 부정적 영향을 시뮬레이션했습니다. 참여 프로세스를 사용하면 다양한 형태의 전문 지식을 결합하고 매우 복잡한 문제를 해결할 수 있습니다.
HEAVY.AI에서는 일반적으로 환경 계획을 하지 않지만, 이 패턴은 비즈니스 환경에서 여전히 매우 잘 작동합니다. 따라서 우리는 고객이 비즈니스의 핵심 부분에 대한 디지털 트윈을 구축하도록 돕고, 비즈니스 시나리오를 빠르게 만들고 평가할 수 있도록 합니다.
제가 가르치는 경험을 통해 소프트웨어 사용자, 특히 복잡한 소프트웨어 시스템에 대해 깊은 공감을 갖게 되었다고 생각합니다. 한 학생이 한 지점에서 실수를 하는 것은 우연이지만, 수십 명이나 수백 명이 비슷한 실수를 한다면 설계 문제가 있다는 것을 알 수 있습니다. 아마도 소프트웨어 설계에서 제가 가장 좋아하는 부분은 이러한 학습을 취하고 새로운 세대의 시스템을 설계하는 데 적용하는 것입니다.
HeavyIQ가 자연어 처리를 활용해 데이터 탐색 및 시각화를 용이하게 하는 방식을 설명해 주시겠습니까?
요즘은 모두가 새로운 genAI 모델을 선전하는 듯합니다. 그 중 대부분은 서로의 잊혀진 복제품입니다. 우리는 매우 다른 길을 택했습니다. 우리는 정확성, 재현성 및 개인 정보 보호가 대규모 언어 모델(LLM)로 생성된 도구를 포함하여 모든 비즈니스 분석 도구에 필수적인 특성이라고 믿습니다. 그래서 우리는 이를 근본적인 수준에서 우리의 제품에 내장했습니다. 예를 들어, 우리는 모델 입력을 엔터프라이즈 데이터베이스에 엄격하게 제한하고 엔터프라이즈 보안 경계 내에서 문서를 제공합니다. 또한 출력을 최신 HeavySQL 및 Charts로 제한합니다. 즉, 어떤 질문을 하든 우리는 귀하의 데이터로 답하려고 노력할 것이고, 그 답을 어떻게 도출했는지 정확히 보여드릴 것입니다.
이러한 보장이 있으면 고객에게는 우리가 쿼리를 정확히 어떻게 처리하는지는 중요하지 않습니다. 하지만 내부적으로는 소비자 genAI와 관련된 또 다른 중요한 차이점은 우리가 비즈니스 사용자가 공간 데이터를 포함하여 비즈니스 데이터에 대해 묻는 특정 유형의 질문에 대해 모델을 광범위하게 미세 조정한다는 것입니다. 예를 들어, 우리 모델은 공간 및 시간 계열 조인을 수행하는 데 탁월하며, 이는 클래식 SQL 벤치마크에는 없지만 사용자가 매일 사용합니다.
우리는 이러한 핵심 기능을 HeavyIQ라고 부르는 Notebook 인터페이스에 패키징합니다. IQ는 자연어 처리(NLP)를 사용하여 데이터 탐색 및 시각화를 가능한 한 직관적으로 만드는 것입니다. “지난주 캘리포니아의 날씨 패턴은 어땠나요?”와 같이 영어로 질문을 하면 HeavyIQ가 이를 GPU 가속 데이터베이스가 빠르게 처리하는 SQL 쿼리로 변환합니다. 결과는 데이터로만 제공되는 것이 아니라 지도, 차트 등 가장 관련성 있는 시각화로 제공됩니다. 특히 대규모 또는 빠르게 움직이는 데이터 세트를 처리할 때 빠르고 대화형 쿼리를 가능하게 하는 것입니다. 여기서 중요한 점은 종종 첫 번째 질문이 아니라 세 번째 질문에서 핵심 통찰력을 얻는다는 점이며 HeavyIQ는 이러한 심층적인 탐색을 용이하게 하도록 설계되었습니다.
통신사, 공공 서비스 회사, 정부 기관이 기존 BI 도구에 비해 HeavyIQ를 사용하는 주요 이점은 무엇입니까?
HeavyIQ는 대규모, 고속 데이터를 처리하는 환경에서 탁월합니다. 이는 바로 통신사, 유틸리티, 정부 기관이 처리하는 데이터 종류입니다. 기존의 비즈니스 인텔리전스 도구는 종종 이 데이터의 양과 속도에 어려움을 겪습니다. 예를 들어, 통신 분야에서는 수십억 개의 통화 기록이 있을 수 있지만 집중해야 할 것은 끊긴 통화의 아주 작은 부분입니다. HeavyIQ를 사용하면 GPU 인프라 덕분에 10~100배 더 빠르게 해당 데이터를 걸러낼 수 있습니다. 이 속도와 데이터를 대화형으로 쿼리하고 시각화하는 기능이 결합되어 유틸리티의 위험 분석이나 정부 기관의 실시간 시나리오 계획에 매우 귀중합니다.
위에서 이미 언급한 다른 장점은 공간 및 시간 SQL 쿼리가 분석적으로 매우 강력하지만 느리거나 직접 작성하기 어려울 수 있다는 것입니다. 시스템이 우리가 “호기심의 속도”라고 부르는 속도로 작동할 때 사용자는 더 많은 질문과 더 미묘한 질문을 모두 할 수 있습니다. 예를 들어 텔레콤 엔지니어는 모니터링 시스템에서 장비 고장의 시간적 급증을 알아차리고 특정 시설에서 무언가 잘못되었다는 직감을 갖고 이를 공간 쿼리로 확인하여 맵을 반환할 수 있습니다.
HeavyIQ를 사용할 때 메타데이터 유출을 방지하기 위해 어떤 조치가 있나요?
위에서 설명한 대로, 우리는 핵심에 프라이버시와 보안을 갖춘 HeavyIQ를 구축했습니다. 여기에는 데이터뿐만 아니라 여러 종류의 메타데이터도 포함됩니다. 우리는 쿼리에 답하는 데 필요한 정보가 포함된 테이블과 열을 결정하는 데 열 및 테이블 수준 메타데이터를 광범위하게 사용합니다. 또한 제공된 경우 내부 회사 문서를 사용하여 검색 증강 생성(RAG)이라고 알려진 것을 지원합니다. 마지막으로 언어 모델 자체가 추가 메타데이터를 생성합니다. 이 모든 것, 특히 마지막 두 가지는 비즈니스에 매우 민감할 수 있습니다.
데이터가 일반적으로 외부 서버로 전송되는 타사 모델과 달리 HeavyIQ는 나머지 플랫폼과 동일한 GPU 인프라에서 로컬로 실행됩니다. 이를 통해 데이터와 메타데이터가 누출 위험 없이 제어되는 것이 보장됩니다. 최고 수준의 보안이 필요한 조직의 경우 HeavyIQ는 완전히 에어갭 환경에 배포될 수도 있어 민감한 정보가 특정 장비를 떠나지 않도록 보장할 수 있습니다.
HEAVY.AI는 GPU 인프라를 사용하여 방대한 데이터 세트에서 높은 성능과 확장성을 어떻게 달성합니까?
비결은 본질적으로 다른 시스템에서 흔히 볼 수 있는 데이터 이동을 피하는 것입니다. 핵심은 NVIDIA GPU에서 실행되도록 처음부터 설계된 특수 데이터베이스에서 시작됩니다. 저희는 10년 이상 이 작업을 해왔으며, GPU 가속 분석에 있어서 동급 최고의 솔루션을 보유하고 있다고 확신합니다.
가장 뛰어난 CPU 기반 시스템조차도 중간 GPU보다 훨씬 먼저 증기가 고갈됩니다. CPU에서 이런 일이 발생하면 이 전략은 여러 코어와 여러 시스템에 데이터를 분산해야 합니다(소위 ‘수평적 확장’). 이는 시간이 덜 중요한 일부 상황에서는 잘 작동하지만 일반적으로 네트워크 성능에 병목 현상이 발생하기 시작합니다.
쿼리에서 이 모든 데이터 이동을 피하는 것 외에도, 우리는 또한 다른 많은 일반적인 작업에서도 이를 피합니다. 첫째, 데이터를 이동하지 않고도 그래픽을 렌더링할 수 있습니다. 그런 다음 ML 추론 모델링을 원하면, 우리는 다시 데이터 이동 없이 이를 수행합니다. 그리고 대규모 언어 모델로 데이터를 조사하는 경우, 우리는 다시 데이터 이동 없이 이를 수행합니다. 데이터 과학자이고 Python에서 데이터를 조사하려는 경우에도, 우리는 다시 데이터 이동 없이 GPU에서 이를 수행하는 방법을 제공합니다.
실제로 이것이 의미하는 바는 우리가 쿼리뿐만 아니라 전통적인 CPU 기반 데이터베이스와 맵 서버보다 10~100배 더 빠르게 렌더링을 수행할 수 있다는 것입니다. 고객이 사용하는 방대한 고속 데이터 세트(예: 날씨 모델, 통신 통화 기록 또는 위성 이미지)를 처리할 때 이러한 종류의 성능 향상은 절대적으로 필수적입니다.
HEAVY.AI는 빠르게 진화하는 빅데이터 분석과 AI 환경에서 어떻게 경쟁 우위를 유지하고 있나요?
훌륭한 질문이고, 우리는 끊임없이 그것에 대해 생각합니다. 빅데이터 분석과 AI의 풍경은 믿을 수 없을 정도로 빠른 속도로 진화하고 있으며, 항상 새로운 돌파구와 혁신이 일어나고 있습니다. GPU 데이터베이스 기술에 있어서 10년의 선두를 달리고 있다는 것은 확실히 도움이 됩니다.
저는 우리에게 가장 중요한 것은 핵심 사명에 집중하는 것이라고 생각합니다. 즉, 대규모 지리공간 데이터에 대한 액세스를 민주화하는 것입니다. 즉, GPU 가속 분석으로 가능한 것의 경계를 지속적으로 넓히고, 이 도메인에서 우리 제품이 타의 추종을 불허하는 성능과 역량을 제공하도록 하는 것입니다. 그 중 큰 부분은 공간 SQL과 지리공간 분석의 뉘앙스를 진정으로 이해하는 맞춤형 미세 조정 언어 모델을 개발하는 데 지속적으로 투자하는 것입니다.
우리는 대화형 분석 도구가 자연스럽고 직관적인 방식으로 사용자와 소통할 수 있도록 하기 위해 일반적인 벤치마크를 훨씬 뛰어넘는 광범위한 교육 데이터 라이브러리를 구축했습니다. 하지만 기술만으로는 충분하지 않다는 것도 알고 있습니다. 우리는 고객과 그들의 변화하는 요구 사항에 깊이 연결되어야 합니다. 결국 우리의 경쟁 우위는 사용자에게 혁신적인 가치를 제공하는 데 끊임없이 집중하는 데 달려 있습니다. 우리는 단순히 시장과 보조를 맞추는 것이 아니라 빅데이터와 AI로 가능한 것의 경계를 넓히고 있습니다. 그리고 우리는 그것이 얼마나 빨리 풍경은 변화한다.
HEAVY.AI는 HeavyEco를 통해 비상 대응 노력을 어떻게 지원합니까?
우리는 일부 가장 큰 유틸리티 고객이 오늘날의 날씨 모델 출력을 수집하고 공동 비교를 위해 시각화하는 데 큰 어려움을 겪는 것을 보고 HeavyEco를 구축했습니다. 한 고객이 데이터를 로드하는 데만 최대 4시간이 걸렸고, 화재와 같이 빠르게 움직이는 극한의 기상 조건에 직면했을 때는…그것은 충분하지 않습니다.
HeavyEco는 산불이나 홍수와 같이 중대한 상황에서 실시간 통찰력을 제공하도록 설계되었습니다. 이러한 시나리오에서는 최상의 데이터를 기반으로 신속하게 결정을 내려야 합니다. 따라서 HeavyEco는 우선 NOAA 및 USGS와 같은 권위 있는 모델을 위한 전문적으로 관리되는 데이터 파이프라인 역할을 합니다. 그 외에도 HeavyEco를 사용하면 시나리오를 실행하고, 빌딩 수준의 영향을 모델링하고, 실시간으로 데이터를 시각화할 수 있습니다. 이를 통해 응급 대응자는 가장 중요한 시기에 필요한 중요한 정보를 얻을 수 있습니다. 복잡하고 대규모 데이터 세트를 즉각적인 의사 결정을 안내할 수 있는 실행 가능한 인텔리전스로 전환하는 것입니다.
궁극적으로, 우리의 목표는 사용자에게 생각의 속도로 데이터를 탐색할 수 있는 능력을 제공하는 것입니다. 복잡한 공간 모델을 실행하든, 날씨 예보를 비교하든, 지리공간 시계열의 패턴을 식별하려고 하든, 우리는 사용자가 어떠한 기술적 장벽도 방해하지 않고 원활하게 수행할 수 있기를 바랍니다.
정확도와 성능 측면에서 HEAVY.AI의 자체 LLM이 다른 타사 LLM과 어떻게 다른가요?
저희의 독점 LLM은 텍스트-SQL 및 텍스트-시각화와 같이 저희가 집중하는 유형의 분석에 맞게 특별히 조정되었습니다. 저희는 처음에 기존의 타사 모델을 시도했지만, 종종 중요한 결정을 내리는 저희 사용자의 높은 정확도 요구 사항을 충족하지 못한다는 것을 알게 되었습니다. 그래서 저희는 다양한 오픈소스 모델을 미세 조정하고 업계 벤치마크에 대해 테스트했습니다.
저희 LLM은 사용자에게 필요한 고급 SQL 개념, 특히 지리공간 및 시간 데이터에 대해 훨씬 더 정확합니다. 또한 GPU 인프라에서 실행되므로 보안도 더 뛰어납니다.
기본 제공 모델 기능 외에도 관리자와 사용자가 도메인 또는 비즈니스 관련 메타데이터를 추가할 수 있는 완전한 대화형 사용자 인터페이스도 제공합니다. 예를 들어, 기본 모델이 예상대로 수행되지 않으면 열 수준 메타데이터를 가져오거나 조정하거나 안내 정보를 추가하고 즉시 피드백을 받을 수 있습니다.
HEAVY.AI는 다양한 산업의 미래를 형성하는 데 있어 공간 및 시간 데이터 분석의 역할을 어떻게 예상합니까?
우리는 공간적 및 시간적 데이터 분석이 많은 산업의 미래에 중요할 것이라고 믿습니다. 우리가 정말로 집중하는 것은 고객이 더 나은 결정을 더 빠르게 내릴 수 있도록 돕는 것입니다. 통신, 유틸리티, 정부 또는 기타 분야에 종사하든 실시간으로 데이터를 분석하고 시각화할 수 있는 능력은 게임 체인저가 될 수 있습니다.
저희의 사명은 이런 종류의 강력한 분석을 방대한 리소스를 가진 대기업뿐만 아니라 모든 사람이 이용할 수 있도록 하는 것입니다. 저희는 고객이 보유한 데이터를 활용하여 앞서 나가고 발생하는 문제를 해결할 수 있도록 보장하고자 합니다. 데이터가 계속 증가하고 복잡해짐에 따라 저희는 저희의 역할이 데이터와 함께 진화하도록 하는 것이라고 생각합니다. 그래서 저희 고객은 항상 다음에 무엇이 일어날지 대비할 수 있습니다.
훌륭한 인터뷰에 감사드립니다. 더 자세히 알고 싶은 독자는 다음을 방문하세요. 헤비.AI.
게시물 HEAVY.AI의 제품 관리 부사장 Mike Flaxman 박사 – 인터뷰 시리즈 처음 등장 유나이트.AI.