그만큼 에이전트포스 여기 있습니다. Salesforce는 연례 행사의 또 다른 버전을 마무리했습니다. 드림포스 컨퍼런스 올해 9월. 수많은 참석자 떼에 합류하여(그리고 깨끗하게 청소된 샌프란시스코 주변으로 그들을 이동시키는 Waymos 떼) 이제 우리 각자는 Salesforce 생태계 내에서 깔끔하게 제어되고 작업을 변환하기 위해 손끝에서 작업을 변환할 수 있는 수많은 에이전트를 갖게 되었습니다. Dreamforce는 미래에 대한 마케팅을 통해 항상 주목을 받았지만, 올해는 AI 기반 에이전트가 어떻게 업무 공간과 고객 경험을 혁신할 것인지에 대한 예상치 못한 설득력 있는 비전을 제시했습니다.
조금만 더 기대를 늦추자. Benioff는 기조연설에서 “우리 요원이 왜 그렇게 환각성이 낮은가?”라고 고민했습니다. 그렇습니다. 연결할 수 있는 데이터, 메타데이터, 워크플로 및 다양한 서비스가 있습니다. 시스템이 Salesforce 내에만 존재하는 한 꽤 이상적으로 들립니다. Salesforce가 프롬프트 엔지니어링을 발명했을 수도 있고 아닐 수도 있습니다. Benioff는 기조 연설에서 아버지가 물음표를 발명했다는 “Austin Powers” Dr. Evil의 독백을 연상시키는 주장도 했습니다. 하지만 Salesforce가 Agentforce 비전을 충족할 수 있을까요? 그렇게 한다면 작업이 어떻게 완료되는지가 큰 문제가 될 것입니다.
하지만 현실적으로 생각해 봅시다. 우리 시스템과 데이터가 모두 Salesforce 내에 있는 것은 아닙니다. 업무의 미래가 함께 일하는 에이전트 그룹에 의해 정의된다면 벽으로 둘러싸인 정원과 폐쇄된 생태계를 통해 비즈니스 전반에 걸쳐 결과를 제공하는 데 실제로 얼마나 도움이 될 수 있습니까? 확실히 Apple, Microsoft, Amazon 및 기타 여러 업체는 우리 앞에 있는 대규모 에이전트 기회를 둘러싸기를 원합니다. 그러나 기술 발전의 각 물결이 비공개 토론과 공개 토론의 다양한 형태를 가져왔기 때문에 궁극적으로 에이전트가 경계를 넘어 서로 협력할 수 있는 표준이 필요하게 될 것입니다. 그렇지 않으면 귀하의 비즈니스 일부만이 이 기회를 충족하게 될 것입니다.
개방형/폐쇄형 난제에 직면했을 때 종종 그러하듯이, 개방형 웹을 앞으로 나아갈 방법으로 살펴보겠습니다. 휴대폰의 앱이 모바일 앱 결과의 무한한 배열을 가능하게 하기 위해 웹 보기가 필요한 것처럼 다가오는 다중 에이전트 개척에도 동일한 것이 필요할 것입니다. Slack과 같은 도구는 간단한 에이전트 상호 작용을 위한 사용자 인터페이스를 강화할 수 있는 Block Kit와 같은 UI 프레임워크를 제공하지만 최신 사용자 경험의 깊이를 처리하기에는 부족합니다. 시계방향 프리즘을 예로 들어보겠습니다. 우리는 내일 달력에 현재 “공백”이 없더라도 회의 시간을 찾을 수 있는 차세대 일정 에이전트를 구축했습니다. 가장 인기 있는 판매 잠재 고객과의 불가능한 미팅을 성사시키기 위해 다른 에이전트를 연결할 때, 정교하고 강력한 수많은 일정 옵션을 확인하거나 탐색할 수 있는 방법이 필요합니다. 이를 위해 웹 보기를 제공하는 것이 앞으로 나아갈 명확한 길입니다.
기조연설 내내 Benioff는 비즈니스 내에서 DIY 에이전트를 원하지 않는다는 진언을 반복했습니다. 그리고 그가 옳습니다. 기업은 반복 가능한 가치를 제공하는 제어되고 단순화된 워크플로를 원합니다. 그럼에도 불구하고 그들은 사일로에 갇히기를 원하지 않습니다. 이것이 바로 다중 에이전트의 미래를 위한 개방형 표준이 필요한 이유입니다. 에이전트가 서로 상호 작용하고, 애플리케이션과 생태계의 경계를 넘고, 기업이 제품 경험을 제어할 수 있는 방식으로 이를 수행할 수 있는 신뢰할 수 있는 방법이 필요합니다.
Atlassian에 연결된 Salesforce 내에서 역방향으로 에이전트 세트를 시작하려는 것과 마찬가지로 Salesforce 고객 사례에 연결된 Atlassian Jira 티켓 내에서 작업 에이전트 세트를 시작할 가능성이 높습니다. 에이전트가 작업 요청이 어디서 발생했는지와 관계없이 일관된 사용자 경험을 바탕으로 다양한 방향으로 함께 작업하려면 이를 수행하기 위한 표준이 다시 필요합니다.
이 표준에는 또 무엇이 표현되어야 합니까? Salesforce 외부의 오늘날 다중 에이전트 생태계는 흥미진진한 황량한 서부와 같습니다. 매일 우리는 AI 시스템과 에이전트 워크플로우를 연결하고 구축하는 새로운 혁신과 방법을 봅니다. 최근 AI 프레임워크 LangChain과 Assitant-UI라는 도구 간의 결합으로 인해 이러한 현상이 발생했습니다. 통찰력:
“UX는 상담원에게 매우 중요합니다. 누구나 자신의 애플리케이션에 스트리밍, 생성 UI, 인간 참여형(Human-In-The-Loop) 기능을 갖춘 에이전트를 원합니다.”
실제로 우리는 이미 상담원에게 사용자 경험이 얼마나 중요한지 다루었습니다. 그리고 상담원은 다른 상담원과 작업할 때 응답을 신속하게 스트리밍할 수 있어야 합니다. 하지만 애플리케이션의 생성적 UI와 인간 참여 루프(Human-In-The-Loop)는 어떻습니까?
Human-In-The-Loop부터 시작하겠습니다. 폭넓게 동의하는 또 다른 영역. Salesforce와 다른 사람들이 자동화에 대해 거창하게 이야기하는 동안, 이는 항상 필요할 때 사람을 다시 센터로 데려올 수 있어야 한다는 필요성에 기반을 두고 있습니다. 우리는 Clockwise에서도 이 교훈을 얻었으며 제안된 일정 옵션 세트를 사용하여 사용자와 다시 체크인할 수 있다는 핵심 개념을 중심으로 일정 에이전트 경험을 구축했습니다. 복잡한 작업을 수행할 때 완전 자동화에 도달하는 것은 놀라운 일이지만 이는 사용자를 참여시키고 루프에 유지하는 백본에서 시작됩니다. 모든 표준은 진행하기 전에 체크인하고 사용자와 확인하는 선택적 기능을 중심으로 구축되어야 하며, 결국 신뢰도가 충분히 높을 때 전체 자동화를 허용해야 합니다.
그러면 생성적 UI는 어떻습니까? 여기서는 반드시 생성적 UI가 아니라 “네이티브 UI”가 필요하다고 제안하겠습니다. 중요한 것은 에이전트가 요청에 응답하는 서비스/에이전트에 의해 제어되는 기본 UI를 생성한다는 것입니다. 기본 서비스만이 에이전트 요청과 관련된 사용자 인터페이스를 렌더링하는 데 필요한 컨텍스트와 이해를 갖습니다. 해당 UI가 생성 AI를 사용하여 렌더링되는지 아니면 AI가 아닌 다른 메커니즘을 사용하여 렌더링되는지 여부는 구현 세부 사항으로 응답 서비스에 맡겨집니다. 따라서 우리는 개방형 표준이 응답 서비스가 에이전트 요청에 대한 기본 UI를 제어하고 전달할 수 있도록 허용해야 한다고 생각합니다.
다음은 무엇입니까? 우리는 개방형 다중 에이전트의 미래가 어떤 모습일지 계속해서 조사하게 되어 기쁩니다. 우리는 우리가 부르는 것의 초안을 만들었습니다. 개방형 다중 에이전트 프로토콜 (OMAP) 그리고 우리는 대화를 계속해서 추진하게 되어 기쁘게 생각합니다. 사람들이 에이전트를 사용하여 강력하고 효율적인 방식으로 작업을 수행하는 완전히 새로운 유형의 작업이 머지않아 등장할 것입니다. Agent Orchestrator 작업 설명의 시대가 다가왔습니다. Salesforce가 앞으로 나아갈 길을 제시하는 동안 에이전트가 경계를 넘어 상호 연결할 수 있는 표준 방법이 필요합니다.
게시물 저환각성 AI에 대한 미세 투여 처음 등장한 Unite.AI.