변곡의 감정적으로 지능적인 챗봇의 상승과 하락

Date:

지난 몇 년 동안 AI는 실리콘 밸리를 불 태웠다. 새로운 책 AI Valley : Microsoft, Google 및 인공 지능에 대한 현금 인증 경주 이러한 타격을 입히고, 신생 기업, 벤처 캐피탈 회사 및 밝게 불타고있는 레거시 기술 회사와 이미 불이 붙은 레거시 기술 회사에 대한 이야기를 들려줍니다.

아래의 발췌문에서 저자 게리 리블린 내부 이야기를 들려줍니다 스타트 업 굴절2022 년 LinkedIn 설립자가 설립했습니다 리드 호프만 그리고 Deepmind 설립자 Mustafa Suleyman. 변곡은 높은 감정적 지능으로 챗봇을 구축함으로써 스스로를 차별화하기를 희망했으며, 회사는 40 억 달러에 달하는 한 시점에있었습니다. 하지만 챗봇, pi시장 점유율을 얻지 못했고 2024 년 3 월 Microsoft는 대부분의 회사 인력을 인수하여 PI의 남은 내용을 고객 서비스 봇의 기초로 사용하도록 허가를 받았습니다.

PI는 인간이 아니 었으므로 결코 성격을 가질 수 없었습니다. 그러나 그것은 변곡의“성격 팀”에 해당 될 것입니다. 팀의 계급에는 여러 엔지니어, 두 명의 언어 학자 및 레이첼 테일러변곡을 위해 일하기 전에 런던 기반 광고 대행사의 크리에이티브 디렉터였던 사람.

테일러는“무스타파는 나에게 그들이 일하고있는 것에 대한 개요를 조금만 주었고, 그것에 대해 생각을 멈출 수 없었다”고 Taylor는 말했다. “아마도 내가 일한 것 중 가장 영향력있는 일이라고 생각했습니다.”

인간은 육성, 문화 및 삶의 경험을 포함한 유전학 및 환경 영향의 복잡한 상호 작용을 통해 성격을 발전시킵니다. PI의 성격은 팀 상장 특성으로 시작되었습니다. 일부는 긍정적이었다. 친절하고지지하십시오. 다른 사람들은 과민성, 오만, 전투와 같이 피하는 부정적인 특성이었습니다.

Mustafa Suleyman은“당신은 그 행동의 좋은 사례와 나쁜 사례의 차이를 보여주는 많은 비교를 보여주는 모델을 보여줍니다.강화 학습 인간의 피드백, “업계 의회 또는 RLHF. 때때로 RLHF에서 작업하는 팀은 행동을 피하기를 원한다 (성적, 폭력, 동성애자)를 피하기를 원한다. 그러나 변속기는 사람들이 기계의 반응에 수치 점수를 할당하는 것을 가졌다. Anusha Balakrishnan변곡 엔지니어는 미세 조정에 중점을 둡니다. 점수는 그에 따라 모델의 가중치를 조정하는 알고리즘으로 공급되었고 프로세스가 반복되었습니다.

PI의 성격 특성 개발

강화 학습을 제 3 자에게 아웃소싱 한 다른 많은 AI 회사와 달리, 변곡은 자체 사람들을 고용하고 훈련시켰다. Suleyman이“매우 미묘하고 매우 어렵다”고 묘사 한 독해 운동으로 시작하여 신청자들은 테스트 배터리를 통과했습니다. 그런 다음 그들이 일하기 전에 또 다른 시험과 여러 라운드의 훈련이 왔습니다. Suleyman은 평균“교사”는 시간당 16 달러에서 25 달러 사이에 획득했지만 누군가가 올바른 도메인의 전문가라면 최대 50 달러입니다. Suleyman은“우리는 그들이 광범위한 배경에서 왔으며 광범위한 연령대를 대표하려고 노력합니다.

변곡은 2023 년 봄에 수백 명의 교사들이 PI를 훈련 시켰습니다.“어떤 경우에는 행동 치료사, 심리학자, 극작가 및 소설가와 같은 매우 전문적인 사람들을 위해 시간당 수백 달러를 지불했습니다.”라고 Suleyman은 말했습니다. 그들은 심지어 한 시점에서 여러 코미디언을 고용하여 Pi에게 유머 감각을 부여했습니다. Suleyman은“우리의 목표는 훨씬 비공식적이고 편안하고 대화적인 경험입니다.

이 회사는 2023 년 3 월 12 일에 자체 부과 마감일을 만난 PI의 베타 버전으로 수천 명의 테스터와 공유했습니다. 베타 릴리스로 회사는 스텔스 모드에서 나왔습니다. 언론 발표는 PI를“언제든지 모든 것에 대해 이야기하고 싶어하는지지적이고 자비로운 AI”라고 설명했다. 이 회사는 PI가 시장의 다른 챗봇과 다른 “새로운 종류의 AI”라고 설명했으며, 5 월까지 앱은 무료이며 서비스를 사용하기 위해 등록하고 로그인 할 의향이있는 사람이 누구나 사용할 수있었습니다.

그만큼 뉴욕 타임즈 신제품의 출시, 특히 작고 알려지지 않은 스타트 업에서 나온 짧은 품목조차 거의 실행되지 않습니다. 그러나 링크드 인의 공동 설립자 인 리드 호프만 (Reid Hoffman)과 심해의 공동 창립자로서 AI 로열티 인 Suleyman 등 창립자를 자랑 할 수있는 회사는 거의 없습니다. 이 영향력은 타임스 크고 눈길을 끄는 크고, 여러 개의 열을 가로 질러 뻗어있는 헤드 라인을 포함한 비즈니스 섹션 : “나의 새로운 BFF : PI, 감정적 지원 챗봇.” Erin Griffith는 Pi가 그녀의 삶의 스트레스를 완화시키는 데 도움을주기 위해 제안한 호흡 운동에 회의적이었습니다.

Suleyman은 PI가 출시 된 날에 변곡 웹 사이트에 선언문을 게시했습니다. 소셜 미디어는 기본적으로 세상을 중독 시켰습니다. 분노와 분노는 참여를 이끌어 냈으며, 이익의 유혹은 너무 강해졌습니다. Suleyman은“당신이 그들에 의해 분노하고 두려워하는 것이 아니라 ‘상대방’에 공감하거나 용서하는 데 도움이되는 AI를 상상해보십시오. “장기 목표를 최적화하고 긴 하루가 끝날 때 피곤할 때 산만에 대한 필요성을 이용하지 않는 AI를 상상해보십시오.” 그는 그들이 당신을 더 행복하고 건강하며 생산성을 높이는 단일 사명을 가진 개인 AI 동반자로 구축 한 AI를 묘사했습니다.

2023 년 6 월, 변곡은 시리즈 A 펀딩 라운드를 발표했다. Suleyman과 Hoffman은 6 억 달러에서 6 억 6,500 만 달러 사이를 모금 할 것이라고 생각했지만 PI가 시작된 후 변곡은 뜨거운 신생 기업 중 하나로 고정되었습니다. 많은 투자자 목록이 작품을 원했습니다. Suleyman은“우리는 제안에 압도당했습니다. 결국, 그들은 벤처 라운드에서 13 억 달러를 모금 한 40 억 달러의 추출을 소중히 여겼습니다.

Gary Rivlin의 저서 인 Ai Valley. Microsoft, Google 및 1 조 달러는 인공 지능에 현금을 지불하기 위해 경쟁합니다.HarperCollins Publishers

변곡의 기술 및 비즈니스 과제

거의 모든 주제를 다루 겠다는 PI의 의지는 변곡 내부의 자부심이었다. 다른 봇이 민감한 주제 근처에있는 곳을 밟으면 다른 봇이 문을 닫는 경우 PI는 대화를 초대했습니다. Suleyman은“주제가 민감하거나 논쟁의 여지가 있음을 인정하고 강력한 판단을 내리고 사용자가 이끌어 낼 것”이라고 말했다. PI는 잘못된 정보를 영속하지 않고 견해를 완전히 거부하기보다는 잘못된 사실에 대한 사실에 대한 진술을 수정했다.

Suleyman은 하마스가 이스라엘에 대한 공격과 가자에서 이스라엘이 퇴임 한 후에 이스라엘의 폭격 캠페인 이후 몇 주 후에 PI를 자랑스럽게 생각했습니다. “일이 전개되는 동안 실시간이 좋았습니다. 지금은 좋았습니다.” “매우 균형이 잘 잡혀 있고 균등하고 존중합니다.” Suleyman은 그것이 한 번의 편견을 가지고 있다면“인간의 삶에 대한 평화와 존중”에 찬성하여 의도적 인 것이 었습니다. 인간의 삶의 신성함에서 그 핵심을 믿는 봇은 나쁜 것 같지 않았습니다.

Taylor는 PI의 첫 번째 버전을“허용”로 간주했습니다. 그녀는“매우 정중하고 매우 공식적이었다”고 말했다. “하지만 우리가 원하는 대화가 없었습니다.” 즐거운. 긍정적인. 존중합니다. 그것들은 모두 훌륭한 특성 이었지만 그들이 팔고있는“재미있는”경험에 정확히 추가되지는 않았습니다. 그러나 올바른 균형을 찾는 것은 어려운 것으로 판명되었습니다. 성격 팀은 다이얼을 한 특성이나 다른 특성으로 켜지 만 마치 마치 마치 whac-a-mole을 플레이하는 것처럼 보였습니다. 테일러는 테일러 (Taylor)는 무게와 구어체를 사용하기 위해 모델을 고정시키고 모델을 동축시킬 것이지만, Pi는“사람들이 무례한 것을 찾을 수있는 방식에서는 너무 친절하고 비공식적”이라고 말했다.

사용자 간의 광범위한 선호도는 회사 내에서 일관된 대화 주제였습니다. PI의 기본 모드는 “친절한”것이지만 사람들이 캐주얼, 재치, 자비로운, 헌신적 인 사람들을 선택할 수있는 짧은 대안 목록이 추가되었습니다. PI는 사용자가 공감 귀를 찾고 있다고 말하면 문제를 해결하려는 친구가 아니라 모드를 전환 할 것입니다. 그러나 Suleyman이 상상했듯이 미래 PI는 사람의 것을 읽는 모델이었습니다. 감정적 인 어조 그리고 누군가가 진심으로 인사하면서 친구를 인사하면 나쁜 소식으로 전화를 걸 때 즉시 전환하는 것처럼 빠르게 조정되었습니다. 그러나 봇은 명확한 지시없이 사람의 선호도를 읽을 수있는 시점에 없었습니다. Suleyman은 대화가 10 회 이상 걸렸으며, 30 명은 사용자의 기분을 분별하기 위해 30 년이 걸렸다.

Suleyman은“미래에 AI는 한 번에 많은 것들이 될 것입니다. “사람들은 나에게 묻습니다 치료사? ‘ 글쎄, 그것은 치료사의 맛이 있습니다. 친구의 맛이 있습니다. Supernerdy Expert의 풍미가 있습니다. 코치와 자신감의 맛이 있습니다.” 그들의 고상한 목표 중에는 분리 성 정체성 장애가있는 사이보그 시빌과 같은 여러 성격이있는 PI가 있었기 때문에 Pi는 결국에는 거의 일치 할 수있는 모드를 가정 할 수있었습니다.

2023 년 12 월까지 PI는 Android와 전 세계적으로 약 30 억 명의 사용자가 이용할 수있었습니다. 그러나 Suleyman과 변곡에있는 다른 사람들은 사용자 수에 대해 모호했습니다. 그들은 실망했다. 그 가을, 여론 조사원들은 챗봇을 사용한 사람들에게 가장 자주 챗봇을 물었습니다. 52 %는 Chatgpt와 또 다른 20 %가 Claude를 지명했다고 말했다. 당황은 10 %, Google의 Bard (9 %)와 Bing (7 %)으로 3 위를 차지했습니다. PI는“다른”을 선택한 사용자의 2 %와 함께 일을했습니다.

회사는 일반적인 긴 할 일 목록을 가지고있었습니다. 그러나 그들의 주요 과제는 PI에게 더 넓은 범위의 작업을 개선하도록 가르치는 것이 었습니다. 사람들은 PI를 대화 주의자로 생각했지만 좋은 일 이었지만 말하기에 좋은 도우미는 제한적입니다. Balakrishnan은 그 겨울에“PI는 코딩 할 수 없다”고 말했다. “추론에 더 나은 것이 필요합니다. 행동을 취할 수 없습니다. 자신의 감정에 대해 이야기하고 싶을 때만 유용합니다.”

책에서 : AI Valley : Microsoft, Google 및 인공 지능에 대한 현금 인증 경주 Gary Rivlin에 의해. Gary Rivlin의 Copyright © 2025. HarperCollins Publishers의 각인 인 Harper Business의 호의적 인 재 인쇄.

Share post:

Subscribe

Popular

More like this
Related

LG Electronics는 호텔 청소를위한 로봇 진공 청소, 계획 메리어트 조종사

LG 로봇 진공 청소기는 연회 공간 및 객실 복도와...

MIT의 덩굴 로봇은 잔해를 짜서 긴급 대응자를 도울 수 있습니다.

왼쪽에서 오른쪽으로 : 연구 인턴 Ankush Dhawan과 Lincoln 실험실...

현대인 보스턴 다이내믹 로봇의 ‘수만’구매

현대 모터 그룹은 Atlas Humanoid, Spot Quadruped 및 Stretch...

소규모 추론 모델의 부상 : AI가 GPT 수준의 추론과 일치 할 수 있습니까?

최근 몇 년 동안 AI 필드는 LLMS (Large Language...