OpenAI는 방금 “세계에서 가장 똑똑한 모델”이라고 부르는 제품을 출시했습니다. 월 200달러의 가격표가 함께 제공되며 이전에 본 것보다 더 열심히 생각하고, 더 오래 일하고, 더 복잡한 문제를 해결할 것을 약속합니다. 그러나 AI 발표가 매주 떨어지는 것처럼 보이는 세상에서 이것은 좀 더 자세히 살펴볼 가치가 있습니다.
새로운 채팅GPT Pro에 의해 구동됨 O1 모델또 다른 정기적인 업그레이드가 아닙니다. 일반 ChatGPT는 AI 도구의 스위스 군용 칼이 되었지만, 이 새로운 제품은 특수 수술 장비에 가깝습니다. 믿을 수 없을 만큼 강력하지만 모든 사람에게 적합한 것은 아닙니다.
o1이 실제로 테이블에 가져오는 것
과장된 광고를 잘라내고 무엇이 o1을 다르게 만드는지 살펴보겠습니다. 모델은 몇 가지 인상적인 수치를 보여주지만, 중요한 것은 이러한 개선이 실제로 어디에서 차이를 만드는지입니다.
실제 테스트에서 o1은 세 가지 주요 영역에서 개선 사항을 보여줍니다.
- 심층적인 기술 문제 해결: 이 모델은 AIME 2024 수학 경쟁 문제에서 이전 버전의 37%보다 향상된 50%의 정확도를 달성했습니다. 그러나 더 중요한 것은 이 성능을 지속적으로 유지한다는 것입니다. 신뢰성 테스트(4번 중 4번 정답 획득)에서 o1 pro 모드는 이전 버전보다 훨씬 뛰어난 성능을 발휘합니다.
- 과학적 추론: 박사 수준의 과학 문제에서 o1은 74%의 성공률을 보여주었으며 일관성 측면에서 훨씬 더 인상적인 향상을 보였습니다. 흥미로운 점은 이것이 실제 연구 응용으로 어떻게 변환되는지입니다. 연구자들이 이를 사용하여 정교한 생물학적 실험을 설계하는 것을 보고 있습니다.
- 프로그래밍 및 기술 분석: 아마도 가장 눈에 띄는 점은 o1이 고급 프로그래밍 과제에서 62%의 합격률을 달성하여 복잡한 다단계 문제 해결에서 특별한 강점을 보여준다는 것입니다. 그러나 이는 매우 중요하며 실제로 앞뒤로 대화가 필요한 단순하고 반복적인 작업에는 어려움을 겪습니다.
여기서 진정한 혁신은 단순한 성능이 아니라 신뢰성입니다. 모델이 문제에 대해 더 열심히 생각해야 할 때 실제로 그렇게 하므로 해당 응답을 처리하고 검증하는 데 더 많은 시간이 걸립니다.
그러나 여기에는 문제가 있습니다. 이 모든 추가 “사고”에는 상충 관계가 따른다는 것입니다. 모델이 눈에 띄게 느려지고 때로는 응답을 생성하는 데 훨씬 더 많은 시간이 필요합니다. 그리고 많은 일상적인 작업에서 이러한 추가 마력은 불필요할 뿐만 아니라 실제로 비생산적일 수도 있습니다.
이 많은 컴퓨팅 성능으로 무슨 일이 일어날까요?
더 많은 컴퓨팅 성능으로 AI를 강화하면 실제로 어떤 일이 일어나는지 이야기해 보겠습니다. 마케팅 이야기는 잊어버리세요. o1에서 우리가 보고 있는 것은 AI 지원에 대한 우리의 생각을 완전히 바꾸기 때문에 매우 흥미롭습니다.
동료와의 빠른 채팅과 심층적인 전략 세션의 차이처럼 생각해보세요. 표준 AI 모델은 빠른 채팅에 적합합니다. 신속하고 유용하며 작업을 완료합니다. 그런데 o1? 그것은 마치 시간을 들여 사물을 깊이 생각하고 때로는 고려조차 하지 않은 통찰력을 가지고 돌아오는 선임 전문가를 갖는 것과 같습니다.
이 접근 방식의 실제로 혁명적인 점은 무엇입니까?
- 더 깊은 “사고”: AI 모델에 “생각”할 시간을 더 주면 모델은 단지 더 오래 생각하는 것이 아니라 다르게 생각하게 됩니다. 여러 각도를 탐색하고 극단적인 경우를 고려합니다. 이것이 연구자들이 실험 설계 및 가설 생성에 특히 유용하다고 생각하는 이유입니다.
- 신뢰할 수 있음: 여기에는 아무도 이야기하지 않는 것이 있습니다. 일관성은 o1의 진정한 초능력일 수 있습니다. 다른 모델은 복잡한 문제를 한 번 해결하고 다음 세 번 실패할 수 있지만 o1은 높은 수준의 추론에서 놀라운 일관성을 보여줍니다. 중요한 문제를 해결하는 전문가에게 이 신뢰성 요소는 매우 중요합니다.
AI 전동 공구에 대한 현명한 구매자 가이드
우리는 200달러라는 가격표에 대해 솔직한 대화를 나눠야 합니다. 정말 그만한 가치가 있나요? 글쎄, 그것은 전적으로 작업 흐름에서 AI 지원에 대해 어떻게 생각하는지에 달려 있습니다.
흥미롭게도 o1에서 가장 큰 이익을 얻을 수 있는 사람들은 반드시 가장 복잡한 문제를 해결하는 사람들은 아닙니다. 그들은 잘못되면 엄청난 비용이 드는 문제를 해결하는 사람들입니다. 이와 같은 특정 상황이 아닌 한, 추가 전력으로 인해 실제로 속도가 느려질 수 있습니다.
o1을 효과적으로 사용하려면 AI 상호 작용에 접근하는 방식에 근본적인 변화가 필요합니다.
- 속도보다 깊이
- 빠르게 왔다 갔다 하는 교환이 아니라, 잘 생각한 연구 쿼리를 만드는 것이라고 생각하세요.
- 더 긴 응답 시간을 계획하되 보다 포괄적인 분석을 기대합니다.
- 양보다 질
- 복잡하고 가치가 높은 문제에 집중
- 일상적인 작업에 표준 모델 사용
- 전략적 배포
- 최적화된 워크플로를 위해 o1을 다른 AI 도구와 결합
- 가장 중요한 곳에 과도한 컴퓨팅 성능을 절약하세요.
o1은 모든 사람에게 모든 것이 되려고 노력하지 않습니다. 대신 AI 도구를 사용하는 방법에 대해 더 전략적으로 생각하도록 유도하고 있습니다. 아마도 여기서 진정한 혁신은 기술뿐만 아니라 AI 지원에 대한 접근 방식을 다시 생각하게 만드는 방식일 것입니다.
AI 툴킷을 전문 주방처럼 생각해보세요. 예, 모든 작업에 산업용 장비를 사용할 수 있지만 마스터 셰프는 언제 멋진 수비드 기계를 사용해야 하는지, 간단한 팬이 작업을 더 잘 수행할 수 있는지 정확히 알고 있습니다.
200달러짜리 구독을 시작하기 전에 다음을 시도해 보세요. 일주일 동안 AI 상호 작용 로그를 유지하세요. 빠른 대응과 더 깊은 사고가 정말로 필요한 것을 표시해 보세요. 이는 어떤 벤치마크보다 o1이 필요한지 여부에 대해 더 많은 것을 알려줄 것입니다.
o1에 대해 나를 가장 흥분시키는 것은 그것이 오늘 할 수 있는 것이 아니라 내일에 대해 우리에게 알려주는 것입니다. 우리는 AI가 모든 일을 하려고 하는 도구에서 자신이 가장 잘하는 것이 무엇인지 정확히 아는 도구로 발전하는 것을 지켜보고 있습니다.
당신이 o1의 편에 서든 아니든 한 가지는 확실합니다. 우리가 AI에 대해 생각하고 사용하는 방식이 진화하고 있으며 이는 주목할 가치가 있다는 것입니다.
게시물 OpenAI의 200달러 ChatGPT Pro: 더 열심히 생각하는 AI(하지만 필요합니까?) 처음 등장한 Unite.AI.