‘라는 수학적 개념이 있습니다.키스 번호. ‘ 다소 실망스럽게도 실제 키스와는 아무런 관련이 없습니다. 그것은 얼마나 많은 구가 얼마나 많은 구가 그것을 교차하지 않고 동일한 크기의 단일 구체를 만질 수 있는지 (또는 ‘키스’) 얼마나 열거합니다. 한 차원에서 키스 번호는 2입니다. 두 차원으로 그것은 6입니다 (생각하십시오 뉴욕 타임즈 ‘ 철자 꿀벌 퍼즐 구성). 치수의 수가 증가함에 따라 대답은 덜 분명 해집니다. 4를 초과하는 대부분의 치수의 경우 키스 번호의 상한과 하한 만 알려져 있습니다. 이제 Google DeepMind가 Alphaevolve라는 AI 에이전트가 문제에 기여하여 592에서 593까지의 11 차원에서 키스 번호의 하한을 증가 시켰습니다.
특히 11 치수의 키스 숫자의 상한이 868이라는 점을 감안할 때 문제에 대한 점진적인 개선처럼 보일 수 있으므로 알려지지 않은 범위는 여전히 상당히 큽니다. 그러나 그것은 AI 에이전트의 새로운 수학적 발견을 나타내며 큰 언어 모델이 있다는 생각에 도전합니다. 능력이 없습니다 독창적 인 과학적 기여.
그리고 이것은 Alphaevolve가 성취 한 것 중 하나 일뿐입니다. “우리는 연구 수학의 다양한 개방 문제에 대해 Alphaevolve를 적용했으며, 수학의 여러 부분에서 의도적으로 분석, 조합, 지오메트리에서 문제를 선택했습니다. Matej BalogDeepMind의 연구 과학자는 프로젝트에서 일했습니다. 그들은 문제의 75 %에 대해 AI 모델이 이미 알려진 최적 솔루션을 복제한다는 것을 발견했습니다. 20 %의 경우 알려진 솔루션을 능가하는 새로운 최적이 발견되었습니다. Balog는“모든 사례는 새로운 발견입니다. (다른 5 %의 경우 AI는 알려진 최적의 솔루션보다 더 나쁜 솔루션에 수렴했습니다.)
이 모델은 또한 많은 기계 학습의 기초가되는 매트릭스 곱셈을위한 새로운 알고리즘을 개발했습니다. alphatensor라고 불리는 DeepMind의 AI 모델의 이전 버전은 이미 이기다 1969 년에 발견 된 이전 가장 잘 알려진 알고리즘은 4 x 4 매트릭스를 곱한 것으로 나타났습니다. Alphaevolve는 개선 된 알고리즘의보다 일반적인 버전을 발견했습니다.
DeepMind의 Alphaevolve는 Google의 몇 가지 실제 문제를 개선했습니다. Google Deepmind
추상 수학 외에도이 팀은 회사가 매일 직면 할 때 Google의 실제 문제에 모델을 적용했습니다. AI는 또한 다음 Google의 디자인을 최적화하기 위해 데이터 센터 오케스트레이션을 최적화하는 데 사용되었습니다. 텐서 처리 장치그리고 쌍둥이 자리 훈련에 사용되는 커널의 개선을 발견하여 훈련 시간이 1 % 감소합니다.
“단일 시스템으로 많은 다른 일을 할 수 있다는 것은 매우 놀랍습니다.”라고 말합니다. 알렉산더 노비 코프Alphaevolve에서 일한 DeepMind의 선임 연구 과학자.
Alphaevolve가 작동하는 방법
Alphaevolve는 코드로 표현할 수 있고 다른 코드로 점검 할 수있는 거의 모든 문제에 적용될 수 있기 때문에 매우 일반적인 상태 일 수 있습니다. 사용자는 문제에 대한 초기 찌르기를 제공하지만, 당면한 문제를 해결하지만 최적으로 해결하는 프로그램과 코드 조각이 필요한 기준을 얼마나 잘 충족시키는 지 확인하는 검증 자 프로그램을 제공합니다.
그런 다음 큰 언어 모델,이 경우 Gemini는 동일한 문제를 해결하기 위해 다른 후보 프로그램을 제시하며 각각은 검증자가 테스트합니다. 거기에서 Alphaevolve를 사용합니다 유전자 알고리즘 제안 된 솔루션의 ‘적합’이 생존하여 다음 세대로 진화합니다. 이 프로세스는 솔루션이 개선을 중단 할 때까지 반복됩니다.
Alphaevolve는 평가 코드와 함께 Gemini Large Language Models (LLM)의 앙상블을 사용하며, 모두 유전자 알고리즘에 의해 조정되어 코드를 최적화합니다. Google Deepmind
“큰 언어 모델이 왔고 우리는 스스로에게 물어보기 시작했습니다. 그들이 훈련 데이터에 무엇이 있는지 추가 할뿐입니다. 아니면 실제로 완전히 새로운 새로운 알고리즘이나 새로운 지식을 발견하기 위해 사용할 수 있습니까?” 발로그가 말한다. Balog는이 연구에 따르면 “큰 언어 모델을 올바른 방식으로 사용한다면 매우 정확한 의미에서 알고리즘의 형태로 새롭고 입증 될 수있는 것을 얻을 수 있습니다.”
alphaevolve 세상을 기절시켰다 체스, GO 및 기타 게임을 배우는 법을 배우면서 게임을하고 사용하여 인간의 지식을 사용하지 않고 인간의 플레이어보다 더 나은 게임 강화 학습 마스터하려면. 강화 학습, 알파 루프를 기반으로 한 또 다른 수학 AI 수행 2024 년 국제 수학 올림피아드에서 은메달리스트 수준에서.
그러나 Alphaevolve의 경우, 팀은 유전자 알고리즘에 유리한 강화 학습 전통에서 벗어났습니다. Balog는“시스템은 훨씬 간단합니다. “그리고 그것은 실제로 광범위한 문제를 설정하는 것이 훨씬 쉽다는 결과가 있습니다.”
(완전히 무섭지 않은) 미래
Alphaevolve의 팀은 두 가지 방법으로 시스템을 발전시키기를 희망합니다.
첫째, 그들은 자연 과학의 문제를 포함하여 광범위한 범위의 문제에 적용하기를 원합니다. 이 목표를 추구하기 위해, 그들은 관심있는 학자들이 연구에서 알파 폴을 사용할 수있는 조기 접근 프로그램을 열 계획입니다. 제안 된 솔루션의 검증이 덜 간단 할 수 있으므로 시스템을 자연 과학에 조정하는 것이 더 어려울 수 있습니다. 그러나 Balog는“자연 과학에는 다양한 유형의 문제에 대한 많은 시뮬레이터가 있으며 Alphaevolve 내에서도 사용될 수 있음을 알고 있습니다. 앞으로는이 방향으로 범위를 넓히는 데 매우 관심이 있습니다.”
둘째, 시스템 자체를 개선하고자합니다. AI 공동 과학자. 이 AI는 또한 LLM과 유전자 알고리즘을 사용하지만 자연어의 가설 생성에 중점을 둡니다. Balog는“그들은 이러한 높은 수준의 아이디어와 가설을 개발합니다. “이 구성 요소를 Alphaevolve와 같은 시스템에 통합하면 더 높은 수준의 추상화로 갈 수 있다고 생각합니다.”
이러한 전망은 흥미롭지 만 일부는 또한 협박 할 수도 있습니다. 예를 들어, Alphaevolve의 Gemini 훈련 최적화와 같은 일부는 재귀 적으로 자기 개선 AI의 시작으로 볼 수 있습니다. 걱정하다 런 어웨이 지능 폭발로 이어질 것입니다. 특이. DeepMind 팀은 물론 그것이 목표가 아니라고 주장합니다. Novikov는“우리는 인류에게 도움이되는 AI의 발전에 기여하게되어 기쁩니다.