마이크로소프트 리서치 도입 자동 생성 복잡한 다중 에이전트 협업이 가능한 AI 에이전트를 구축하기 위한 오픈소스 Python 프레임워크로 2023년 9월에 출시되었습니다. AutoGen은 이미 연구원, 개발자 및 조직 사이에서 인기를 얻었으며 290명이 넘는 기여자가 참여하고 있습니다. GitHub 2024년 5월 현재 약 900,000건의 다운로드가 이루어졌습니다. 이러한 성공을 바탕으로 Microsoft는 개발자가 AI 에이전트를 신속하게 프로토타입화하고 실험할 수 있도록 지원하는 로우 코드 인터페이스인 AutoGen Studio를 공개했습니다.
이 라이브러리는 복잡한 작업을 해결하고 의사 결정을 자동화하며 코드를 효율적으로 실행하기 위해 원활하게 상호 작용할 수 있는 지능형 모듈식 에이전트를 개발하기 위한 것입니다.
마이크로소프트도 최근 출시했다. 오토젠 스튜디오 대화형이며 사용자 친화적인 플랫폼을 제공하여 AI 에이전트 개발을 단순화합니다. 이전 버전과 달리 AutoGen Studio는 광범위한 코딩의 필요성을 최소화하여 사용자가 에이전트를 드래그 앤 드롭하고, 워크플로를 구성하고, AI 기반 솔루션을 쉽게 테스트할 수 있는 그래픽 사용자 인터페이스(GUI)를 제공합니다.
AutoGen을 독특하게 만드는 것은 무엇입니까?
AI 에이전트 이해
AI의 맥락에서 에이전트는 종종 자연어 처리 및 기계 학습을 사용하여 특정 작업을 수행할 수 있는 자율 소프트웨어 구성 요소입니다. Microsoft의 AutoGen 프레임워크는 기존 AI 에이전트의 기능을 향상시켜 복잡하고 구조화된 대화에 참여하고 다른 에이전트와 협력하여 공유 목표를 달성할 수 있도록 해줍니다.
AutoGen은 다양한 에이전트 유형과 대화 패턴을 지원합니다. 이러한 다양성을 통해 이전에는 사람의 개입이 필요했던 워크플로를 자동화할 수 있으므로 금융, 광고, 소프트웨어 엔지니어링 등과 같은 다양한 산업 분야의 애플리케이션에 이상적입니다.
대화형 및 맞춤형 에이전트
AutoGen은 메시지를 처리하고, 응답을 생성하고, 자연어 지침을 기반으로 작업을 수행하도록 설계된 “대화 가능한” 에이전트 개념을 도입합니다. 이러한 에이전트는 풍부한 대화에 참여할 수 있을 뿐만 아니라 특정 작업에 대한 성능을 향상시키기 위해 사용자 정의할 수도 있습니다. 이 모듈식 설계는 AutoGen을 단순하고 복잡한 AI 프로젝트 모두를 위한 강력한 도구로 만듭니다.
주요 에이전트 유형:
- 보조 에이전트: 코딩, 디버깅, 복잡한 쿼리 응답 등의 작업을 처리할 수 있는 LLM 기반 도우미입니다.
- 사용자 프록시 에이전트: 사용자 동작을 시뮬레이션하여 개발자가 실제 사용자를 개입시키지 않고도 상호 작용을 테스트할 수 있습니다. 또한 코드를 자율적으로 실행할 수도 있습니다.
- 그룹 채팅 상담원: 협력하여 작업하는 에이전트 모음으로, 다양한 기술이나 관점이 필요한 시나리오에 이상적입니다.
다중 에이전트 협업
AutoGen의 가장 인상적인 기능 중 하나는 다중 에이전트 협업. 개발자는 각각 전문적인 역할을 맡은 에이전트 네트워크를 생성하여 복잡한 작업을 보다 효율적으로 처리할 수 있습니다. 이러한 에이전트는 서로 통신하고, 정보를 교환하고, 집단적으로 결정을 내릴 수 있으므로 시간이 많이 걸리거나 오류가 발생하기 쉬운 프로세스를 간소화할 수 있습니다.
AutoGen의 핵심 기능
1. 다중 에이전트 프레임워크
AutoGen은 각 에이전트가 독립적으로 또는 다른 에이전트와 협력하여 작업할 수 있는 에이전트 네트워크 생성을 용이하게 합니다. 프레임워크는 완전히 자율적이거나 필요한 경우 사람의 감독을 포함하는 워크플로를 설계할 수 있는 유연성을 제공합니다.
대화 패턴은 다음과 같습니다:
- 일대일 대화: 두 에이전트 간의 간단한 상호 작용.
- 계층 구조: 에이전트는 하위 에이전트에게 작업을 위임하여 복잡한 문제를 보다 쉽게 처리할 수 있습니다.
- 그룹 대화: 에이전트가 협업하여 작업을 해결하는 다중 에이전트 그룹 채팅입니다.
2. 코드 실행 및 자동화
많은 AI 프레임워크와 달리 AutoGen을 사용하면 에이전트가 코드를 자동으로 생성, 실행 및 디버깅할 수 있습니다. 이 기능은 사람의 개입을 최소화하고 개발 주기를 가속화하므로 소프트웨어 엔지니어링 및 데이터 분석 작업에 매우 중요합니다. 사용자 프록시 에이전트는 실행 가능한 코드 블록을 식별하고 실행하며 출력을 자율적으로 구체화할 수도 있습니다.
3. 도구 및 API와의 통합
AutoGen 에이전트는 외부 도구, 서비스 및 API와 상호 작용하여 기능을 크게 확장할 수 있습니다. 데이터베이스에서 데이터를 가져오거나, 웹을 요청하거나, Azure 서비스와 통합하는 등 AutoGen은 기능이 풍부한 애플리케이션을 구축하기 위한 강력한 에코시스템을 제공합니다.
4. 인간 참여형(Human-In-The-Loop) 문제 해결
사람의 입력이 필요한 시나리오에서 AutoGen은 다음을 지원합니다. 인간-에이전트 상호작용. 개발자는 특정 작업을 진행하기 전에 인간 사용자에게 지침이나 승인을 요청하도록 에이전트를 구성할 수 있습니다. 이 기능을 사용하면 적절한 수준의 감독을 통해 신중하게 중요한 결정을 내릴 수 있습니다.
AutoGen 작동 방식: 심층 분석
에이전트 초기화 및 구성
AutoGen 작업의 첫 번째 단계는 에이전트를 설정하고 구성하는 것입니다. 각 에이전트는 특정 작업을 수행하도록 맞춤화될 수 있으며, 개발자는 사용되는 LLM 모델, 활성화된 기술 및 실행 환경과 같은 매개변수를 맞춤화할 수 있습니다.
에이전트 상호 작용 조정
AutoGen은 구조화된 방식으로 에이전트 간의 대화 흐름을 처리합니다. 일반적인 작업 흐름은 다음과 같습니다.
- 업무소개: 사용자나 에이전트가 쿼리나 작업을 소개합니다.
- 에이전트 처리: 관련 에이전트가 입력을 분석하고, 응답을 생성하거나 작업을 수행합니다.
- 에이전트 간 통신: 에이전트는 데이터와 통찰력을 공유하고 협력하여 작업을 완료합니다.
- 작업 실행: 에이전트는 필요에 따라 코드를 실행하고, 정보를 가져오거나 외부 시스템과 상호 작용합니다.
- 종료: 작업이 완료되거나, 오류 임계값에 도달하거나, 종료 조건이 트리거되면 대화가 종료됩니다.
오류 처리 및 자체 개선
AutoGen의 에이전트는 오류를 지능적으로 처리하도록 설계되었습니다. 작업이 실패하거나 잘못된 결과가 생성되는 경우 에이전트는 문제를 분석하고 수정을 시도하며 솔루션을 반복할 수도 있습니다. 이러한 자가 치유 기능은 장기간에 걸쳐 자율적으로 작동할 수 있는 안정적인 AI 시스템을 만드는 데 중요합니다.
전제조건 및 설치
AutoGen을 사용하기 전에 AI 에이전트, 오케스트레이션 프레임워크 및 Python 프로그래밍의 기본 사항을 확실하게 이해하고 있는지 확인하세요. AutoGen은 Python 기반 프레임워크이며 OpenAI의 GPT 모델 또는 Microsoft Azure AI와 같은 다른 AI 서비스와 결합하면 그 잠재력이 최대한 실현됩니다.
다음을 사용하여 AutoGen 설치 pip
:
최적화된 검색 기능 또는 외부 라이브러리와의 통합과 같은 추가 기능의 경우:
환경 설정
AutoGen에서는 환경 변수와 API 키를 안전하게 구성해야 합니다. 작업공간을 초기화하고 구성하는 데 필요한 기본 단계를 살펴보겠습니다.
- 환경 변수 로드: 민감한 API 키를
.env
파일을 사용하여 로드합니다.dotenv
보안을 유지하기 위해. (api_key = os.environ.get(“OPENAI_API_KEY”)) - 언어 모델 구성 선택: OpenAI의 GPT-4 또는 기타 선호하는 모델 등 사용할 LLM을 결정합니다. 에이전트 간의 원활한 통신을 위해서는 API 엔드포인트, 모델 이름, 키와 같은 구성 설정을 명확하게 정의해야 합니다.
복잡한 시나리오를 위한 AutoGen 에이전트 구축
다중 에이전트 시스템을 구축하려면 에이전트를 정의하고 에이전트의 작동 방식을 지정해야 합니다. AutoGen은 각각 고유한 역할과 기능을 가진 다양한 에이전트 유형을 지원합니다.
보조자 및 사용자 프록시 에이전트 만들기: 코드 실행 및 사용자 상호 작용 관리를 위한 정교한 구성으로 에이전트를 정의합니다.
게시물 Microsoft AutoGen: 고급 자동화를 갖춘 다중 에이전트 AI 워크플로 처음 등장한 Unite.AI.