인용 : Anthropic의 새로운 기능이 AI의 신뢰 문제를 해결할 수 있습니까?

Date:

AI 확인은 한동안 심각한 문제였습니다. 하는 동안 대형 언어 모델 (LLMS) 놀라운 속도로 발전했으며 정확성을 입증하는 데 어려움은 해결되지 않은 채로 남아 있습니다.

인류 이 문제를 해결하려고 노력하고 있으며 모든 대기업 회사 중에서 가장 좋은 샷을 가지고 있다고 생각합니다.

회사가 출시되었습니다 인용새로운 API 기능 클로드 모델 이는 AI 시스템이 응답을 확인하는 방법을 변경합니다. 이 기술은 소스 문서를 소화 가능한 청크로 자동 분류하고 모든 AI 생성 된 진술을 원래 소스에 연결합니다.

인용은 AI의 가장 지속적인 과제 중 하나를 해결하려고 시도하고 있습니다. 생성 된 컨텐츠가 정확하고 신뢰할 수 있음을 증명합니다. 복잡한 프롬프트 엔지니어링 또는 수동 확인을 요구하지 않고 시스템은 문서를 자동으로 처리하고 모든 클레임에 대해 문장 수준 소스 검증을 제공합니다.

이 데이터는 유망한 결과를 보여줍니다. 전통적인 방법에 비해 인용 정확도가 15% 향상되었습니다.

이것이 지금 중요한 이유입니다

AI Trust는 엔터프라이즈 채택 (개인 채택뿐만 아니라)의 중요한 장벽이되었습니다. 조직이 실험 AI 사용을 넘어 핵심 작업으로 이동함에 따라 AI 출력을 효율적으로 확인할 수 없기 때문에 상당한 병목 현상이 생겼습니다.

현재 검증 시스템은 명확한 문제를 보여줍니다. 조직은 속도와 정확도 중에서 선택해야합니다. 수동 검증 프로세스는 확장되지 않지만, 비확산 된 AI 출력은 너무 많은 위험을 초래합니다. 이 과제는 특히 정확도가 선호되지 않는 규제 산업에서 특히 심각합니다.

인용시기는 AI 개발에서 중요한 순간에 도달합니다. 언어 모델이 더욱 정교 해짐에 따라 내장 검증의 필요성은 비례 적으로 증가했습니다. 정확성이 협상 할 수없는 전문 환경에서 자신있게 배포 할 수있는 시스템을 구축해야합니다.

기술 아키텍처를 분류합니다

인용의 마법은 문서 처리 방식에 있습니다. 인용은 다른 전통적인 AI 시스템과 다릅니다. 이들은 종종 문서를 간단한 텍스트 블록으로 취급합니다. 인용을 통해이 도구는 소스 자료를 “청크”라고 부르는 것으로 분류합니다. 이들은 개별 문장 또는 사용자 정의 섹션 일 수 있으며, 검증을위한 세분화 된 기초를 만들었습니다.

기술적 인 분석은 다음과 같습니다.

문서 처리 및 처리

인용 프로세스는 형식을 기준으로 문서를 다르게 다룹니다. 텍스트 파일의 경우 총 요청에 대해서는 표준 200,000 토큰 캡을 넘어서는 본질적으로 제한이 없습니다. 여기에는 귀하의 상황, 프롬프트 및 문서 자체가 포함됩니다.

PDF 처리가 더 복잡합니다. 시스템은 PDF를 텍스트뿐만 아니라 시각적으로 처리하여 몇 가지 주요 제약으로 이어집니다.

  • 32MB 파일 크기 제한
  • 문서 당 최대 100 페이지
  • 각 페이지에는 1,500-3,000 개의 토큰이 소비됩니다

토큰 관리

이제이 한계의 실제 측면으로 돌아갑니다. 인용 작업을 수행 할 때는 토큰 예산을 신중하게 고려해야합니다. 다음은 분해 방법입니다.

표준 텍스트 :

  • 전체 요청 제한: 200,000 토큰
  • 포함 : 컨텍스트 + 프롬프트 + 문서
  • 인용 출력에 대한 별도의 요금이 없습니다

PDFS의 경우 :

  • 페이지 당 더 높은 토큰 소비
  • 시각적 처리 오버 헤드
  • 더 복잡한 토큰 계산이 필요했습니다

인용 대 래그 : 주요 차이점

인용은 아닙니다 검색 증강 세대 (rag) 시스템 – 그리고이 차이점은 중요합니다. RAG 시스템은 지식 기반에서 관련 정보를 찾는 데 중점을두고 있지만 인용은 이미 선택한 정보에 대해 작동합니다.

이런 식으로 생각하십시오 : RAG는 ​​사용 할 정보를 결정하는 반면 인용은 정보를 정확하게 사용하도록 보장합니다. 이것은 다음을 의미합니다.

  • 조각: 정보 검색을 처리합니다
  • 인용 : 정보 확인을 관리합니다
  • 결합 된 잠재력 : 두 시스템 모두 함께 작동 할 수 있습니다

이 아키텍처 선택은 인용이 제공된 컨텍스트 내에서 정확도로 탁월한 동시에 보완 시스템에 검색 전략을 남기는 것을 의미합니다.

통합 경로 및 성능

설정은 간단합니다. 인용이 통과됩니다 Anthropic의 표준 API당신이 이미 Claude를 사용하고 있다면, 당신은 그곳에 있습니다. 이 시스템은 메시지 API와 직접 통합되어 별도의 파일 스토리지 또는 복잡한 인프라 변경이 필요하지 않습니다.

가격 구조는 주요 이점을 가진 Anthropic의 토큰 기반 모델을 따릅니다. 소스 문서에서 입력 토큰을 지불하는 동안 인용 출력 자체에 대한 추가 비용은 없습니다. 이것은 사용으로 확장되는 예측 가능한 비용 구조를 만듭니다.

성능 메트릭은 설득력있는 이야기를 들려줍니다.

  • 전체 인용 정확도의 15% 개선
  • 소스 환각의 완전한 제거 (10%에서 0에서 0까지)
  • 모든 클레임에 대한 문장 수준 확인

비 검증 된 AI 시스템을 사용하는 조직 (및 개인)은 특히 규제 된 산업 또는 정확도가 중요한 고위험 환경에서 자신을 불리하게 찾고 있습니다.

앞으로 우리는 다음을 볼 수 있습니다.

  • 인용과 같은 기능의 통합이 표준이됩니다
  • 텍스트를 넘어 다른 미디어에 대한 검증 시스템의 진화
  • 산업 별 검증 표준의 개발

전체 산업은 실제로 AI 신뢰성과 검증을 다시 생각해야합니다. 사용자는 모든 클레임을 쉽게 확인할 수있는 지점에 도달해야합니다.

게시물 인용 : Anthropic의 새로운 기능이 AI의 신뢰 문제를 해결할 수 있습니까? 먼저 나타났습니다 Unite.ai.

Share post:

Subscribe

Popular

More like this
Related

Honeywell은 자동화, 항공 우주 사업을 분사합니다

Honeywell은 1 년 전에 시작된 포괄적 인 비즈니스 포트폴리오...

로봇 공학은 농장에서 혁명을 이끌고 있다고 Helukabel은 설명합니다

Helukabel은 로봇 공학, 디지털화 및 수직 및 정밀 농업이...

Gazebo Classic Robotics 시뮬레이터는 수명이 끝납니다

전망대 로봇 시뮬레이터의 스크린 샷. 크레딧 : 오픈 소스...