AI 뉴스허브

Voxel51의 새로운 자동 표지 기술 약속은 100,000x의 주석 비용을 줄이겠다는 약속

Voxel51의 새로운 자동 표지 기술 약속은 100,000x의 주석 비용을 줄이겠다는 약속

컴퓨터 비전 스타트 업의 획기적인 새로운 연구 복셀 51 기존 데이터 주석 모델이 업이 될 것이라고 제안합니다. 오늘 발표 된 연구 에서이 회사는 새로운 자동 표지 시스템이 인적 수준의 정확도의 최대 95%를 달성하면서 5,000 배 더 빠르고 최대 1 명을 달성한다고보고합니다.00,000x 저렴합니다 수동 라벨링보다.

이 연구는 Yolo-World 및 Grounding Dino와 같은 Foundation 모델을 Coco, Lvis, BDD100K 및 VOC를 포함한 잘 알려진 데이터 세트에서 벤치마킹했습니다. 놀랍게도, 많은 실제 시나리오에서, 모델은 인간 라벨에 대해 훈련 된 AI 생성 레이블에 대해서만 훈련 된 모델입니다. 건축 회사의 경우 컴퓨터 비전 시스템의 의미는 엄청납니다. 수백만 달러의 주석 비용을 절약 할 수 있으며 모델 개발주기는 몇 주에서 몇 시간까지 줄어들 수 있습니다.

주석의 새로운 시대 : 수동 노동에서 모델 주도 파이프 라인까지

수십 년 동안 데이터 주석 AI 개발에서 고통스러운 병목 현상이었습니다. Imagenet에서 자율 주행 차량 데이터 세트에 이르기까지 팀은 인간 근로자들의 방대한 군대에 의존하여 경계 상자와 세그먼트 객체를 그려 비용이 많이 들고 느리게 노력했습니다.

일반적인 논리는 간단했습니다. 더 많은 인간으로 표지 된 데이터 = 더 나은 ai. 그러나 Voxel51의 연구는 그 가정을 뒤집습니다.

그들의 접근 방식은 미리 훈련 된 재단 모델을 활용합니다 제로 샷 기능 – 활성 학습을 사용하면서 일상적인 라벨링을 자동화하여 인간 검토를위한 불확실하거나 복잡한 사례를 표시하는 파이프 라인에 통합합니다. 이 방법은 시간과 비용을 크게 줄입니다.

한 번의 테스트에서 NVIDIA L40S GPU를 사용한 340 만 개를 라벨링하는 데 1 시간 이상이 걸렸으며 1.18 달러가 소요되었습니다. AWS Sagemaker와 수동으로 동일한 작업을 수행하는 데는 거의 7,000 시간이 걸렸으며 124,000 달러 이상의 비용이 들었습니다. 특히 어려운 경우 (Coco 또는 Lvis 데이터 세트에서 드문 범주를 식별하는 것과 같은 경우, Auto-Rabeled Model가 때때로 성능이 우수합니다 그들의 인간으로 표지 된 상대. 이 놀라운 결과는 Foundation 모델의 일관된 라벨링 패턴과 대규모 인터넷 데이터에 대한 교육에서 비롯 될 수 있습니다.

Voxel51 내부 : 팀은 시각적 AI 워크 플로를 재구성합니다

2016 년에 설립 제이슨 코소 교수 그리고 브라이언 무어 미시간 대학교에서 Voxel51은 원래 비디오 분석에 중점을 둔 컨설팅으로 시작했습니다. Computer Vision and Robotics의 베테랑 인 Corso는 150 개가 넘는 학술 논문을 출판했으며 AI 커뮤니티에 광범위한 오픈 소스 코드를 제공합니다. 무어, 전 박사 학위 Corso의 학생은 CEO로 일하고 있습니다.

전환점은 팀이 대부분의 AI 병목 현상이 모델 디자인이 아니라 데이터에 있다는 것을 인식했을 때 발생했습니다. 그 통찰력은 그들에게 영감을주었습니다 Fiftyone엔지니어가 시각적 데이터 세트를보다 효율적으로 탐색, 큐레이터 및 최적화 할 수 있도록 설계된 플랫폼.

수년에 걸쳐 회사는 인상되었습니다 $ 45m,, a $ 12.5m 시리즈 a 그리고 a $ 30m 시리즈 b Bessemer Venture Partners가 이끄는. 기업 채택은 LG Electronics, Bosch, Berkshire Grey, Precision Planting 및 Voxel51의 도구를 생산 AI 워크 플로에 통합하는 Rios와 같은 주요 고객과 함께 이어졌습니다.

도구에서 플랫폼으로 : Fiftyone의 확장 역할

FiftyOne은 간단한 데이터 세트 시각화 도구에서 포괄적 인 데이터 중심 AI 플랫폼으로 성장했습니다. Coco, Pascal Voc, Lvis, BDD100K, Open Images와 같은 다양한 형식 및 라벨링 스키마를 지원하며 Tensorflow 및 Pytorch와 같은 프레임 워크와 완벽하게 통합됩니다.

시각화 도구 이상인 FiftyOne은 중복 이미지 찾기, 잘못 표지 된 샘플 식별, 표면 특이 치를 식별하며 모델 고장 모드 측정을 활성화합니다. 플러그인 생태계는 광학 문자 인식, 비디오 Q & A 및 임베딩 기반 분석을위한 사용자 정의 모듈을 지원합니다.

Enterprise 버전 인 Fiftyone Teams는 버전 제어, 액세스 권한 및 클라우드 스토리지와의 통합 (예 : S3)과 같은 공동 작업 기능뿐만 아니라 Labelbox 및 CVAT와 같은 주석 도구를 소개합니다. 특히, 복셀 51 V7 Labs와 파트너 관계를 맺고 있습니다 데이터 세트 큐 레이션과 수동 주석 사이의 흐름을 간소화합니다.

주석 산업을 다시 생각합니다

Voxel51의 자동 표지 연구는 거의 $ 1B 주석 산업을 뒷받침하는 가정에 도전합니다. 전통적인 워크 플로에서 모든 이미지는 인간이 비싸고 종종 중복되는 프로세스 인 인간에 의해 손상되어야합니다. Voxel51은이 노동의 대부분이 이제 제거 될 수 있다고 주장한다.

그들의 시스템을 사용하면 대부분의 이미지는 AI로 표시되며 Edge 케이스 만 인간에게 확대됩니다. 이 하이브리드 전략은 비용을 절감 할뿐만 아니라 인간의 노력이 가장 어렵거나 귀중한 주석을 위해 예약되어 있기 때문에 전체 데이터 품질을 높입니다.

이 변화는 AI 필드의 더 넓은 경향과 유사합니다. 데이터 중심 AI– 모델 아키텍처를 끝없이 튜닝하는 대신 교육 데이터 최적화에 중점을 둔 방법론.

경쟁 환경 및 산업 수신

Bessemer와 같은 투자자는 Voxel51을 AI의 “데이터 오케스트레이션 계층”으로 봅니다. DevOps 도구 혁신 된 소프트웨어 개발. 오픈 소스 도구는 수백만 개의 다운로드를 수상했으며 커뮤니티에는 전 세계 수천 명의 개발자와 ML 팀이 포함됩니다.

Snorkel AI, Roboflow 및 Activeloop과 같은 다른 신생 기업도 데이터 워크 플로우에 중점을 두지 만 Voxel51은 폭, 오픈 소스 정신 및 엔터프라이즈 등급 인프라로 눈에 띄게됩니다. Voxel51의 플랫폼은 주석 공급자와 경쟁하는 대신 선택적 큐 레이션을 통해 기존 서비스를보다 효율적으로 만드는 것을 보완합니다.

미래의 의미

장기적인 의미는 심오합니다. 널리 채택 된 경우 복셀 51의 방법론은 컴퓨터 비전의 진입 장벽을 극적으로 낮출 수 있으며, 신생 기업과 광대 한 라벨링 예산이 부족한 연구자들을위한 분야를 민주화 할 수 있습니다.

비용 절감 외에도이 접근법은 또한 지속적인 학습 시스템생산 모델이 자동으로 실패를 깃발 한 다음, 동일한 조정 된 파이프 라인 내에서 검토, 재사용 및 교육 데이터로 다시 접 힙니다.

이 회사의 광범위한 비전은 AI가 어떻게 진화하는지에 일치합니다. 더 똑똑한 모델뿐만 아니라 더 똑똑한 워크 플로. 그 비전에서 주석은 죽지 않았지만 더 이상 무차별 노동의 영역이 아닙니다. 전략적이고 선택적이며 자동화에 의해 주도됩니다.

게시물 Voxel51의 새로운 자동 표지 기술 약속은 100,000x의 주석 비용을 줄이겠다는 약속 먼저 나타났습니다 Unite.ai.

Exit mobile version