AI 뉴스허브

AgentOps를 갖춘 자율 에이전트: AI 애플리케이션을 위한 관찰성, 추적성 및 그 이상

AgentOps를 갖춘 자율 에이전트: AI 애플리케이션을 위한 관찰성, 추적성 및 그 이상

AgentOps를 갖춘 자율 에이전트: AI 애플리케이션을 위한 관찰성, 추적성 및 그 이상

LLM(대형 언어 모델)과 같은 기본 모델(FM)에 의한 자율 에이전트의 성장은 복잡한 다단계 문제를 해결하는 방법을 개혁했습니다. 이러한 에이전트는 고객 지원부터 소프트웨어 엔지니어링까지 다양한 작업을 수행하며 추론, 도구 사용 및 기억을 결합하는 복잡한 워크플로를 탐색합니다.

그러나 이러한 시스템의 기능과 복잡성이 증가함에 따라 관찰 가능성, 신뢰성 및 규정 준수에 대한 문제가 대두됩니다.

AgentOps가 등장하는 곳입니다. DevOps 및 MLOps를 모델로 삼았지만 FM 기반 에이전트의 수명주기를 관리하기 위해 맞춤화된 개념입니다.

AgentOps에 대한 기본적인 이해와 FM 기반 자율 에이전트의 관찰 가능성 및 추적성을 활성화하는 데 있어 AgentOps의 중요한 역할을 제공하기 위해 최근 논문에서 통찰력을 얻었습니다. 기초 모델 기반 에이전트의 관찰 가능성을 활성화하기 위한 AgentOps 분류 Liming Dong, Qinghua Lu, Liming Zhu 지음. 이 백서에서는 AgentOps에 대한 포괄적인 탐색을 제공하고 생성 및 실행부터 평가 및 모니터링에 이르기까지 자율 에이전트의 수명주기를 관리하는 데 있어 AgentOps의 필요성을 강조합니다. 저자는 추적 가능한 아티팩트를 분류하고, 관찰 플랫폼의 주요 기능을 제안하고, 의사 결정 복잡성 및 규정 준수와 같은 문제를 해결합니다.

하는 동안 에이젠트옵스 (도구)는 AI 에이전트(예: 자생적인크루 ai), 이 기사는 AI 운영(Ops)의 더 넓은 개념에 중점을 둡니다.

즉, AgentOps(도구)는 세션 재생, LLM 비용 추적, 규정 준수 모니터링과 같은 기능을 통해 개발자에게 에이전트 워크플로에 대한 통찰력을 제공합니다. AI에서 가장 인기 있는 Ops 도구 중 하나인 이 기사의 뒷부분에서는 튜토리얼을 통해 해당 기능을 살펴보겠습니다.

AgentOps란 무엇입니까?

AgentOps는 프로덕션 환경에서 FM 기반 자율 에이전트를 설계, 배포, 모니터링 및 최적화하는 데 필요한 엔드투엔드 프로세스, 도구 및 프레임워크를 나타냅니다. 목표는 다음과 같습니다.

AgentOps의 핵심은 엄격한 추적 및 모니터링을 유지하는 동시에 반복적인 다단계 워크플로, 도구 통합 및 적응형 메모리를 강조하여 기존 MLOps를 뛰어넘는 것입니다.

AgentOps가 해결하는 주요 과제

1. 복잡성 에이전트 시스템

자율 에이전트는 광범위한 작업 공간에서 작업을 처리하므로 모든 단계에서 결정이 필요합니다. 이러한 복잡성에는 정교한 계획 및 모니터링 메커니즘이 필요합니다.

2. 관찰 가능성 요구 사항

의료 진단이나 법률 분석 등 위험도가 높은 사용 사례에는 세분화된 추적성이 필요합니다. EU AI Act와 같은 규정을 준수하면 강력한 관찰 가능성 프레임워크의 필요성이 더욱 강조됩니다.

3. 디버깅 및 최적화

다단계 워크플로에서 오류를 식별하거나 중간 출력을 평가하는 것은 상담원의 작업을 자세히 추적하지 않으면 어렵습니다.

4. 확장성 및 비용 관리

프로덕션용 확장 에이전트는 품질 저하 없이 효율성을 보장하기 위해 지연 시간, 토큰 사용량, 운영 비용 등의 측정항목을 모니터링해야 합니다.

AgentOps 플랫폼의 핵심 기능

1. 에이전트 생성 및 사용자 정의

개발자는 구성 요소 레지스트리를 사용하여 에이전트를 구성할 수 있습니다.

에이전트는 사전 정의된 규칙을 준수하면서 특정 데이터 세트, 도구 및 프롬프트와 상호 작용하도록 구축되었습니다.

2. 관찰 가능성 및 추적

AgentOps는 자세한 실행 로그를 캡처합니다.

Langfuse 또는 Arize와 같은 관찰 도구는 이러한 추적을 시각화하는 대시보드를 제공하여 병목 현상이나 오류를 식별하는 데 도움이 됩니다.

3. 신속한 관리

신속한 엔지니어링은 에이전트 행동을 형성하는 데 중요한 역할을 합니다. 주요 기능은 다음과 같습니다:

4. 피드백 통합

사람의 피드백은 반복적인 개선에 여전히 중요합니다.

이 피드백 루프는 에이전트의 성능과 테스트에 사용되는 평가 벤치마크를 모두 개선합니다.

5. 평가 및 테스트

AgentOps 플랫폼은 다음에 대한 엄격한 테스트를 촉진합니다.

6. 기억과 지식 통합

에이전트는 컨텍스트(예: 대화 기록)를 위해 단기 기억을 활용하고 과거 작업에서 얻은 통찰력을 저장하기 위해 장기 기억을 활용합니다. 이를 통해 에이전트는 시간이 지나도 일관성을 유지하면서 동적으로 적응할 수 있습니다.

7. 모니터링 및 지표

포괄적인 모니터링 트랙:

이러한 측정항목은 사용자 세션, 프롬프트, 워크플로 등 여러 측면에서 시각화되어 실시간 개입이 가능합니다.

추적 가능한 유물의 분류

이 백서는 AgentOps 관찰 가능성을 뒷받침하는 아티팩트의 체계적인 분류를 소개합니다.

이 분류법은 에이전트 수명 주기 전반에 걸쳐 일관성과 명확성을 보장하므로 디버깅 및 규정 준수를 보다 쉽게 ​​관리할 수 있습니다.

AgentOps (도구) 연습

이는 AI 에이전트를 모니터링하고 최적화하기 위해 AgentOps를 설정하고 사용하는 과정을 안내합니다.

1단계: AgentOps SDK 설치

원하는 Python 패키지 관리자를 사용하여 AgentOps를 설치합니다.

pip install agentops

2단계: AgentOps 초기화

먼저 AgentOps를 가져오고 API 키를 사용하여 초기화하세요. API 키를 다음 위치에 저장합니다. .env 보안용 파일:

# Initialize AgentOps with API Keyimport agentopsimport osfrom dotenv import load_dotenv# Load environment variablesload_dotenv()AGENTOPS_API_KEY = os.getenv("AGENTOPS_API_KEY")# Initialize the AgentOps clientagentops.init(api_key=AGENTOPS_API_KEY, default_tags=["my-first-agent"])

이 단계에서는 애플리케이션의 모든 LLM 상호 작용에 대한 관찰 가능성을 설정합니다.

3단계: 데코레이터를 사용하여 작업 기록

다음을 사용하여 특정 기능을 계측할 수 있습니다. @record_action 매개변수, 실행 시간 및 출력을 추적하는 데코레이터입니다. 예는 다음과 같습니다.

from agentops import record_action@record_action("custom-action-tracker")def is_prime(number):    """Check if a number is prime."""    if number 

이제 함수가 AgentOps 대시보드에 기록되어 실행 시간 및 입출력 추적에 대한 지표를 제공합니다.

4단계: 지정 에이전트 추적

명명된 에이전트를 사용하는 경우 @track_agent 모든 작업과 이벤트를 특정 에이전트에 연결하는 데코레이터입니다.

from agentops import track_agent@track_agent(name="math-agent")class MathAgent:    def __init__(self, name):        self.name = name    def factorial(self, n):        """Calculate factorial recursively."""        return 1 if n == 0 else n * self.factorial(n - 1)

이제 이 에이전트 내의 모든 작업이나 LLM 호출이 "math-agent" 꼬리표.

5단계: 다중 에이전트 지원

여러 에이전트를 사용하는 시스템의 경우 더 나은 관찰을 위해 에이전트 전체에서 이벤트를 추적할 수 있습니다. 예는 다음과 같습니다.

@track_agent(name="qa-agent")class QAAgent:    def generate_response(self, prompt):        return f"Responding to: {prompt}"@track_agent(name="developer-agent")class DeveloperAgent:    def generate_code(self, task_description):        return f"# Code to perform: {task_description}"qa_agent = QAAgent()developer_agent = DeveloperAgent()response = qa_agent.generate_response("Explain observability in AI.")code = developer_agent.generate_code("calculate Fibonacci sequence")

각 통화는 AgentOps 대시보드의 해당 에이전트 추적 아래에 표시됩니다.

6단계: 세션 종료

세션 종료를 알리려면 다음을 사용하세요. end_session 방법. 선택적으로 세션 상태(Success 또는 Fail) 및 이유.

# End of sessionagentops.end_session(state="Success", reason="Completed workflow")

이렇게 하면 AgentOps 대시보드에 모든 데이터가 기록되고 액세스할 수 있습니다.

7단계: AgentOps 대시보드에서 시각화

방문하다 AgentOps 대시보드 탐험하다:

향상된 예: 재귀적 사고 감지

AgentOps는 에이전트 워크플로에서 반복 루프 감지도 지원합니다. 재귀적 감지를 사용하여 이전 예제를 확장해 보겠습니다.

@track_agent(name="recursive-agent")class RecursiveAgent:    def solve(self, task, depth=0, max_depth=5):        """Simulates recursive task solving with depth control."""        if depth >= max_depth:            return f"Max recursion depth reached for task: {task}"        return self.solve(task, depth + 1)recursive_agent = RecursiveAgent()output = recursive_agent.solve("Optimize database queries")print(output)

AgentOps는 세션의 일부로 재귀를 기록하여 무한 루프나 과도한 깊이를 식별하는 데 도움을 줍니다.

결론

LLM과 같은 기본 모델로 구동되는 자율 AI 에이전트는 산업 전반에 걸쳐 복잡하고 다단계 문제에 접근하는 방법을 재정의했습니다. 그러나 그 정교함은 관찰성, 추적성, 신뢰성 측면에서 독특한 과제를 안겨줍니다. 여기서 AgentOps는 필수 프레임워크로 개입하여 개발자에게 수명 주기 전반에 걸쳐 AI 에이전트의 규정 준수를 모니터링, 최적화 및 보장할 수 있는 도구를 제공합니다.

게시물 AgentOps를 갖춘 자율 에이전트: AI 애플리케이션을 위한 관찰성, 추적성 및 그 이상 처음 등장한 Unite.AI.

Exit mobile version