AI 뉴스허브

국제 수학 올림피아드의 AI: AlphaProof와 AlphaGeometry 2가 은메달 수준을 달성한 방법

국제 수학 올림피아드의 AI: AlphaProof와 AlphaGeometry 2가 은메달 수준을 달성한 방법

국제 수학 올림피아드의 AI: AlphaProof와 AlphaGeometry 2가 은메달 수준을 달성한 방법

수학적 추론은 인간의 인지 능력에 필수적인 측면으로, 과학적 발견과 기술 개발의 진전을 주도합니다. 인간의 인지와 일치하는 인공 일반 지능을 개발하기 위해 노력함에 따라 AI에 고급 수학적 추론 기능을 제공하는 것이 필수적입니다. 현재 AI 시스템은 기본적인 수학 문제를 처리할 수 있지만 대수 및 기하학과 같은 고급 수학 분야에 필요한 복잡한 추론에는 어려움을 겪습니다. 그러나 Google DeepMind가 만든 것처럼 이는 변화할 수 있습니다. 상당한 진전 AI 시스템의 수학적 추론 능력을 향상시키는 데 있어서 이 획기적인 발전은 국제수학올림피아드 (IMO) 2024. 1959년에 설립된 IMO는 가장 오래되고 권위 있는 수학 대회로, 전 세계 고등학생들에게 대수, 조합론, 기하학, 수론의 문제에 도전합니다. 매년 젊은 수학자들이 6가지 매우 어려운 문제를 풀기 위해 경쟁합니다. 올해 Google DeepMind는 두 가지 AI 시스템을 선보였습니다. 형식적 수학적 추론에 초점을 맞춘 AlphaProof와 기하학적 문제를 푸는 데 특화된 AlphaGeometry 2입니다. 이러한 AI 시스템은 6가지 문제 중 4가지를 해결하여 은메달리스트 수준의 성과를 거두었습니다. 이 글에서는 이러한 시스템이 어떻게 작동하여 수학적 문제를 해결하는지 살펴보겠습니다.

AlphaProof: 수학적 정리 증명을 위한 AI와 형식 언어 결합

AlphaProof는 형식 언어를 사용하여 수학적 진술을 증명하도록 설계된 AI 시스템입니다. 기대다. 통합합니다 쌍둥이 자리사전 훈련된 언어 모델 알파제로체스, 쇼기, 바둑의 대가로 유명한 강화 학습 알고리즘입니다.

제미니 모델은 자연어 문제 진술을 공식적 진술로 변환하여 다양한 난이도의 문제 라이브러리를 만듭니다. 이는 두 가지 목적을 달성합니다. 부정확한 자연어를 수학적 증명을 검증하기 위한 정확한 공식 언어로 변환하고, 제미니의 예측 능력을 사용하여 공식 언어 정밀도로 가능한 솔루션 목록을 생성합니다.

AlphaProof가 문제에 부딪히면 잠재적 솔루션을 생성하고 Lean에서 증명 단계를 검색하여 이를 검증하거나 반증합니다. 이는 본질적으로 신경 상징적 접근 방식으로, 신경망 Gemini가 자연어 명령어를 상징적 공식 언어 Lean으로 변환하여 진술을 증명하거나 반증합니다. 시스템이 스스로 게임을 하면서 학습하는 AlphaZero의 자체 플레이 메커니즘과 유사하게, AlphaProof는 수학적 진술을 증명하려고 시도하여 스스로를 훈련합니다. 각 증명 시도는 AlphaProof의 언어 모델을 개선하며, 성공적인 증명은 모델의 더 어려운 문제를 해결하는 역량을 강화합니다.

국제 수학 올림피아드(IMO)를 위해 AlphaProof는 다양한 난이도와 수학적 주제를 다루는 수백만 개의 문제를 증명하거나 반증함으로써 훈련되었습니다. 이 훈련은 대회 기간 동안 계속되었고, AlphaProof는 문제에 대한 완전한 답을 찾을 때까지 솔루션을 개선했습니다.

AlphaGeometry 2: LLM과 심볼릭 AI를 통합하여 기하학 문제를 해결합니다.

AlphaGeometry 2는 최신 버전입니다. 알파지오메트리 시리즈는 향상된 정밀도와 효율성으로 기하학적 문제를 해결하도록 설계되었습니다. 이전 버전의 기반을 바탕으로 AlphaGeometry 2는 신경 대규모 언어 모델(LLM)과 심볼릭 AI를 병합하는 신경-심볼릭 접근 방식을 사용합니다. 이 통합은 규칙 기반 논리와 신경망의 예측 능력을 결합하여 기하학 문제를 해결하는 데 필수적인 보조 지점을 식별합니다. AlphaGeometry의 LLM은 새로운 기하학적 구조를 예측하는 반면, 심볼릭 AI는 형식 논리를 적용하여 증명을 생성합니다.

기하학적 문제에 직면했을 때, AlphaGeometry의 LLM은 수많은 가능성을 평가하여 문제 해결에 중요한 구조를 예측합니다. 이러한 예측은 귀중한 단서 역할을 하여 심볼릭 엔진을 정확한 추론으로 안내하고 솔루션에 더 가까이 다가갑니다. 이 혁신적인 접근 방식을 통해 AlphaGeometry는 기존 시나리오를 넘어서는 복잡한 기하학적 과제를 해결할 수 있습니다.

AlphaGeometry 2의 한 가지 주요 개선 사항은 Gemini LLM의 통합입니다. 이 모델은 이전 모델보다 훨씬 더 많은 합성 데이터에서 처음부터 학습되었습니다. 이 광범위한 학습을 ​​통해 물체 이동 및 각도, 비율 또는 거리 방정식을 포함한 더 어려운 기하 문제를 처리할 수 있습니다. 또한 AlphaGeometry 2는 두 자릿수 더 빠르게 작동하는 심볼릭 엔진을 특징으로 하여 전례 없는 속도로 대안 솔루션을 탐색할 수 있습니다. 이러한 발전으로 인해 AlphaGeometry 2는 복잡한 기하 문제를 해결하는 강력한 도구가 되어 이 분야의 새로운 표준을 제시합니다.

IMO에서의 AlphaProof와 AlphaGeometry 2

올해 국제수학올림피아드(IMO)에서 참가자들은 6가지 다양한 문제로 시험을 봤습니다. 대수학 2개, 수론 1개, 기하학 1개, 조합론 2개입니다. 구글 연구원 번역됨 이러한 문제를 AlphaProof와 AlphaGeometry 2를 위한 공식 수학 언어로 변환했습니다. AlphaProof는 두 개의 대수 문제와 한 개의 수론 문제를 다루었는데, 여기에는 올해 5명의 인간 참가자만이 해결한 대회에서 가장 어려운 문제가 포함되었습니다. 한편, AlphaGeometry 2는 기하학 문제를 성공적으로 해결했지만 두 개의 조합론 과제는 통과하지 못했습니다.

IMO의 각 문제는 7점이며, 최대 42점까지 합산됩니다. AlphaProof와 AlphaGeometry 2는 28점을 획득하여 풀었던 문제에서 완벽한 점수를 받았습니다. 이는 은메달 부문에서 상위권에 속합니다. 올해 금메달 기준은 29점으로, 609명의 참가자 중 58명이 달성했습니다.

Next Leap: 수학 과제를 위한 자연어

AlphaProof와 AlphaGeometry 2는 AI의 수학적 문제 해결 능력에서 인상적인 발전을 보여주었습니다. 그러나 이러한 시스템은 여전히 ​​수학적 문제를 처리를 위한 공식 언어로 번역하기 위해 인간 전문가에 의존합니다. 또한 이러한 전문화된 수학적 기술이 가설 탐색, 오래된 문제에 대한 혁신적인 솔루션 테스트, 증명의 시간 소모적인 측면을 효율적으로 관리하는 것과 같이 다른 AI 시스템에 어떻게 통합될 수 있는지 불분명합니다.

이러한 한계를 극복하기 위해 Google 연구원들은 Gemini와 최신 연구를 기반으로 한 자연어 추론 시스템을 개발하고 있습니다. 이 새로운 시스템은 공식적인 언어 번역 없이도 문제 해결 능력을 향상시키는 것을 목표로 하며 다른 AI 시스템과 원활하게 통합되도록 설계되었습니다.

결론

International Mathematical Olympiad에서 AlphaProof와 AlphaGeometry 2의 성과는 복잡한 수학적 추론을 해결하는 AI의 능력에 있어서 주목할 만한 도약입니다. 두 시스템 모두 6개의 어려운 문제 중 4개를 해결하여 은메달 수준의 성과를 보였으며, 형식적 증명과 기하학적 문제 해결에서 상당한 진전을 보였습니다. 이러한 성과에도 불구하고, 이러한 AI 시스템은 여전히 ​​문제를 형식 언어로 변환하기 위해 인간의 입력에 의존하고 있으며 다른 AI 시스템과 통합하는 데 어려움을 겪고 있습니다. 향후 연구는 이러한 시스템을 더욱 개선하여 자연어 추론을 통합하여 더 광범위한 수학적 과제에 걸쳐 기능을 확장하는 것을 목표로 합니다.

게시물 국제 수학 올림피아드의 AI: AlphaProof와 AlphaGeometry 2가 은메달 수준을 달성한 방법 처음 등장 유나이트.AI.

Exit mobile version