기술 회사에서 인공 지능의 역할은 빠르게 발전하고 있습니다. AI 사용 사례는 수동 정보 처리에서 작업을 실행할 수있는 능동적 인 에이전트로 발전했습니다. 2025 년 3 월 Global AI 채택에 대한 조사에 따르면 조지아와 뉴턴성장 단계 및 기업 회사의 기술 경영진의 91%가 에이전트 AI를 사용하거나 사용하는 것으로 알려졌다.
API-Calling Agents는 이러한 에이전트로의 전환의 주요 예입니다. API-Calling Agents는 LLM (Large Language Model)을 활용하여 API (Application Programming Interfaces)를 통해 소프트웨어 시스템과 상호 작용합니다.
예를 들어, 자연어 명령을 정확한 API 호출로 변환함으로써 에이전트는 실시간 데이터를 검색하거나 일상적인 작업을 자동화하거나 다른 소프트웨어 시스템을 제어 할 수 있습니다. 이 기능은 AI 에이전트를 인간 의도와 소프트웨어 기능 사이의 유용한 중개자로 변환합니다.
회사는 현재 다음을 포함한 다양한 도메인에서 API 통화 에이전트를 사용하고 있습니다.
- 소비자 응용 프로그램 : Apple의 Siri 또는 Amazon의 Alexa와 같은 조수는 스마트 홈 장치 제어 및 예약과 같은 일상적인 작업을 단순화하도록 설계되었습니다.
- 엔터프라이즈 워크 플로 : Enterprise는 API 에이전트를 배포하여 CRM에서 데이터 검색, 보고서 생성 또는 내부 시스템에서 정보를 통합하는 것과 같은 반복적 인 작업을 자동화했습니다.
- 데이터 검색 및 분석 : 기업은 API 에이전트를 사용하여 독점 데이터 세트, 구독 기반 리소스 및 공개 API에 대한 액세스를 단순화하여 통찰력을 생성합니다.
이 기사에서는 API 통화 에이전트를 이해, 구축 및 최적화하는 엔지니어링 중심의 접근 방식을 사용합니다. 이 기사의 자료는 Georgian ‘s AI Lab이 수행 한 실제 연구 및 개발에 부분적으로 기반을두고 있습니다. API 통신 에이전트 분야에서 AI 실험실의 연구에 대한 동기 부여 질문은 다음과 같습니다.
API 국민 에이전트의 작동 방식과 이러한 에이전트를 성능을 위해 성공적으로 설계하고 엔지니어링하는 방법을 설명합니다. 마지막으로, 엔지니어링 팀이 API 통화 에이전트를 구현하는 데 사용할 수있는 체계적인 워크 플로우를 제공 할 것입니다.
I. 주요 정의 :
- API 또는 응용 프로그램 프로그래밍 인터페이스 : 다양한 소프트웨어 응용 프로그램이 정보를 전달하고 교환 할 수있는 일련의 규칙 및 프로토콜.
- 대리인: 환경을 인식하고 결정을 내리고 특정 목표를 달성하기 위해 조치를 취하도록 설계된 AI 시스템.
- API 통화 에이전트 : 자연어 지침을 정확한 API 호출로 변환하는 특수 AI 에이전트.
- 코드 생성 에이전트 : 코드를 작성, 수정 및 디버깅하여 소프트웨어 개발에 도움이되는 AI 시스템. 관련이 있지만 여기서 내 초점은 주로 에이전트에 있습니다. 부르다 API, AI도 도와 줄 수 있습니다 짓다 이 요원들.
- MCP (모델 컨텍스트 프로토콜) : 특히 프로토콜 Anthropic에 의해 개발되었습니다LLM이 외부 도구 및 데이터 소스를 연결하고 활용할 수있는 방법을 정의합니다.
II. 핵심 작업 : 자연어를 API 동작으로 변환합니다
API 통신 에이전트의 기본 기능은 사용자의 자연어 요청을 해석하고 하나 이상의 정확한 API 호출로 변환하는 것입니다. 이 과정은 일반적으로 다음과 같습니다.
- 의도 인식 : 모호하게 표현 되더라도 사용자의 목표를 이해합니다.
- 도구 선택 : 의도를 이행 할 수있는 일련의 사용 가능한 옵션 세트에서 적절한 API 종말점 또는 “도구”를 식별합니다.
- 매개 변수 추출 : 사용자의 쿼리에서 선택한 API 호출에 필요한 매개 변수를 식별하고 추출합니다.
- 실행 및 응답 생성 : API 호출을하고 응답을받은 다음이 정보를 일관된 답변으로 합성하거나 후속 조치를 수행합니다.
“이봐 시리, 오늘 날씨는 어때?”와 같은 요청을 고려하십시오. 에이전트는 날씨 API를 호출 해야하는 필요성을 식별하고 사용자의 현재 위치를 결정하거나 위치의 사양을 허용 한 다음 API 호출을 공식화하여 날씨 정보를 검색해야합니다.
“Hey Siri, 오늘 날씨는 어떻습니까?”라는 요청에 대해서는 샘플 API 호출이 다음과 같습니다.
Get /V1 /Weather? Location = New%20york & Units = Metric
자연어의 모호성과 다단계 상호 작용에 걸쳐 에이전트가 컨텍스트를 유지 해야하는 필요성을 포함 하여이 번역 과정에서 초기 고급 도전 과제가 내재되어 있습니다.
예를 들어, 에이전트는 종종 대화의 이전 부분 또는 이전 API 호출 결과를 “기억”하여 현재 작업을 알리야합니다. 컨텍스트 손실은 명시 적으로 관리하지 않으면 공통 실패 모드입니다.
III. 솔루션 아키텍처 : 주요 구성 요소 및 프로토콜
효과적인 API 통신 에이전트를 구축하려면 구조화 된 아키텍처 접근이 필요합니다.
1. 에이전트의 “도구”정의
LLM이 API를 사용하려면 API 기능을 이해할 수있는 방식으로 설명해야합니다. 각 API 종말점 또는 기능은 종종 “도구”로 표시됩니다. 강력한 도구 정의에는 다음이 포함됩니다.
- 도구의 목적과 기능에 대한 명확하고 자연스러운 설명.
- 입력 매개 변수의 정확한 사양 (이름, 유형, 필수 또는 선택 사항 및 설명).
- 출력 또는 데이터에 대한 설명 도구가 반환됩니다.
2. 모델 컨텍스트 프로토콜 (MCP)의 역할
MCP는 LLM의 표준화되고 강력한 공구 사용을위한 중요한 인 에이 블러입니다. 모델이 외부 도구 및 데이터 소스에 연결하는 방법을 정의하기위한 구조화 된 형식을 제공합니다.
MCP 표준화는 다양한 도구를보다 쉽게 통합 할 수 있기 때문에 유익합니다. 다른 에이전트 또는 모델에서 도구 정의의 재사용 성을 촉진합니다. 또한 OpenAPI 사양과 같은 잘 정의 된 API 사양으로 시작하여 엔지니어링 팀의 모범 사례입니다. Stainless.ai와 같은 도구는 이러한 OpenAPI 사양을 MCP 구성으로 변환하여 API를 “에이전트 준비”로 만드는 프로세스를 간소화하도록 설계되었습니다.
3. 에이전트 프레임 워크 및 구현 선택
여러 프레임 워크가 에이전트 자체를 구축하는 데 도움이 될 수 있습니다. 여기에는 다음이 포함됩니다.
- Pydantic : Pydantic은 독점적으로 에이전트 프레임 워크는 아니지만 데이터 구조를 정의하고 공구 입력 및 출력에 대한 유형 안전을 보장하는 데 유용하며, 이는 안정성에 중요합니다. 많은 맞춤형 에이전트 구현은이 구조적 무결성을 위해 Pydantic을 활용합니다.
- Lastmile의 MCP_AGENT : 이 프레임 워크는 MCPS와 함께 작동하도록 특별히 설계되었으며, 인류와 같은 장소의 연구에서 설명한대로 효과적인 에이전트를 구축하기위한 관행과 일치하는보다 의견이 많은 구조를 제공합니다.
- 내부 프레임 워크 : 또한 AI 코드 생성 에이전트 (커서 또는 클라인과 같은 도구를 사용하여)를 사용하여 에이전트, 도구 및 주변 논리에 대한 보일러 플레이트 코드를 작성하는 데 점점 더 일반적입니다. 대리인 구현에 관한 회사와 협력하는 Georgian의 AI Lab Experience는 매우 최소한의 맞춤형 프레임 워크를 만드는 데 도움이 될 수 있습니다.
IV. 신뢰성 및 성능을위한 엔지니어링
에이전트가 API 호출을 안정적으로 발산하고 잘 수행하도록하려면 집중된 엔지니어링 노력이 필요합니다. 이를 수행하는 두 가지 방법은 (1) 데이터 세트 생성 및 검증 및 (2) 신속한 엔지니어링 및 최적화입니다.
1. 데이터 세트 생성 및 유효성 검사
훈련 (해당되는 경우), 테스트 및 에이전트 최적화에는 고품질 데이터 세트가 필요합니다. 이 데이터 세트는 대표 자연어 쿼리와 해당 원하는 API 호출 시퀀스 또는 결과로 구성되어야합니다.
- 수동 생성 : 수동으로 데이터 세트를 큐 레이션하면 높은 정밀도와 관련성을 보장하지만 노동 집약적 일 수 있습니다.
- 합성 생성 : 프로그래밍 방식으로 또는 LLM을 사용하여 데이터를 생성하면 데이터 세트 생성을 확장 할 수 있지만이 접근법은 중요한 과제를 제시합니다. Georgian AI Lab의 연구에 따르면 합성 생성 된 API 호출 및 쿼리의 정확성과 현실적인 복잡성을 보장하는 것은 매우 어렵다는 것을 발견했습니다. 종종 생성 된 질문은 너무 사소하거나 불가능하게 복잡하여 미묘한 에이전트 성능을 측정하기가 어렵습니다. 합성 데이터의 신중한 검증은 절대적으로 중요합니다.
비판적 평가를 위해, 더 작고 고품질의 수동으로 검증 된 데이터 세트는 종종 크고 시끄러운 합성보다 더 신뢰할 수있는 통찰력을 제공합니다.
2. 프롬프트 엔지니어링 및 최적화
LLM 기반 에이전트의 성능은 추론 및 도구 선택을 안내하는 데 사용되는 프롬프트에 의해 크게 영향을받습니다.
- 효과적인 프롬프트에는 에이전트의 작업을 명확하게 정의하고 사용 가능한 도구에 대한 설명을 제공하고 정확한 매개 변수 추출을 장려하기위한 프롬프트를 구성하는 것이 포함됩니다.
- 프레임 워크와 같은 체계적인 최적화 dspy 성능을 크게 향상시킬 수 있습니다. DSPY를 사용하면 에이전트의 구성 요소 (예 : 사고 생성 모듈, 도구 선택, 매개 변수 형식)를 정의 한 다음 데이터 세트의 몇 가지 샷 예제와 함께 컴파일러와 같은 접근 방식을 사용하여 이러한 구성 요소에 대한 최적화 된 프롬프트 또는 구성을 찾을 수 있습니다.
V. 효과적인 API 에이전트에 대한 권장 경로
강력한 API 통신 AI 에이전트를 개발하는 것은 반복적 인 엔지니어링 분야입니다. Georgian AI Lab의 연구 결과를 바탕으로 다음과 같은 체계적인 워크 플로를 사용하여 결과가 크게 개선 될 수 있습니다.
- 명확한 API 정의로 시작하십시오. 잘 구조화 된 것으로 시작하십시오 OpenApi 사양 API의 경우 에이전트가 상호 작용합니다.
- 표준화 도구 액세스 : OpenAPI 사양을 변환하십시오 MCP 도구와 같은 도구 stainless.ai 이를 용이하게하여 에이전트가 API를 이해하고 사용할 수있는 표준화 된 방법을 만들 수 있습니다.
- 에이전트 구현 : 적절한 프레임 워크 또는 접근 방식을 선택하십시오. 여기에는 사용이 포함될 수 있습니다 Pydantic 사용자 정의 에이전트 구조 내 데이터 모델링 또는 같은 프레임 워크 활용 Lastmile의 MCP_AGENT 그것은 MCP 주변에 구축되었습니다.
- 이 작업을 수행하기 전에 MCP를 Claude Desktop 또는 Cline과 같은 도구에 연결 하고이 인터페이스를 수동으로 사용하여 일반 에이전트가 얼마나 잘 사용할 수 있는지, MCP를 올바르게 사용하는 데 일반적으로 필요한지 및 구현 중에 시간을 절약 할 수있는 다른 세부 사항을 느끼십시오.
- 품질 평가 데이터 세트 큐 레이트 : 쿼리 및 예상 API 상호 작용의 데이터 세트를 수동으로 생성하거나 세 심하게 검증합니다. 이것은 신뢰할 수있는 테스트 및 최적화에 중요합니다.
- 에이전트 프롬프트 및 논리 최적화 : 같은 프레임 워크를 사용합니다 dspy 에이전트의 프롬프트 및 내부 논리를 개선하여 데이터 세트를 사용하여 정확성과 신뢰성을 향상시킵니다.
VI. 워크 플로의 예시 예
다음은 API 호출 에이전트 구축에 권장되는 워크 플로를 보여주는 단순화 된 예입니다.
1 단계 : 명확한 API 정의로 시작하십시오
OpenApi에 정의 된 간단한 할 일 목록을 관리하기위한 API를 상상해보십시오.
OpenApi : 3.0.0
정보 :
제목 : 할 일 목록 API
버전 : 1.0.0
경로 :
/작업 :
우편:
요약 : 새로운 작업을 추가하십시오
요청 바디 :
필수 : True
콘텐츠:
응용 프로그램/JSON :
개요:
유형 : 객체
속성:
설명:
유형 : 문자열
응답 :
‘201’:
설명 : 작업이 성공적으로 생성되었습니다
얻다:
요약 : 모든 작업을 받으십시오
응답 :
‘200’:
설명 : 작업 목록
2 단계 : 표준화 도구 액세스
OpenAPI 사양을 MCP (Model Context Protocol) 구성으로 변환하십시오. Stainless.ai와 같은 도구를 사용하면 다음과 같은 결과를 얻을 수 있습니다.
도구 이름 | 설명 | INPU INPU t 매개 변수 | 출력 설명 |
작업을 추가하십시오 | 할 일 목록에 새로운 작업을 추가합니다. | `description ‘(문자열, 필수) : 작업의 설명. | 작업 작성 확인. |
작업을 받으십시오 | 할 일 목록에서 모든 작업을 검색합니다. | 없음 | 설명이있는 작업 목록. |
3 단계 : 에이전트 구현
데이터 모델링에 Pydantic을 사용하여 MCP 도구에 해당하는 기능을 만듭니다. 그런 다음 LLM을 사용하여 자연어 쿼리를 해석하고 적절한 도구 및 매개 변수를 선택하십시오.
4 단계 : 품질 평가 데이터 세트를 큐 레이트하십시오
데이터 세트 생성 :
질문 | 예상 API 호출 | 예상 결과 |
“내 목록에 ‘식료품 구매’를 추가하십시오.” | `description ‘=“식료품 구매”와 함께`작업’추가 | 작업 작성 확인 |
“내 목록에 무엇이 있습니까?” | `작업을 얻으십시오 | “식료품 구매”를 포함한 작업 목록 |
5 단계 : 에이전트 프롬프트 및 논리 최적화
DSPY를 사용하여 평가 및 개선을 위해 선별 된 데이터 세트를 사용하여 명확한 지침, 공구 선택 및 매개 변수 추출에 중점을 둡니다.
구조화 된 API 정의 및 표준화 된 도구 프로토콜에서 엄격한 데이터 관행 및 체계적인 최적화에 이르기까지 이러한 빌딩 블록을 통합함으로써 엔지니어링 팀은보다 유능하고 신뢰할 수 있고 유지 관리 가능한 API 통화 AI 에이전트를 구축 할 수 있습니다.
게시물 API 통화 에이전트 이해, 구축 및 최적화에 대한 안내 먼저 나타났습니다 Unite.ai.