AI 뉴스허브

Google은 SLM을 교사로 사용하여 AI 교육을 28% 더 빠르게 만들고 있습니다.

Google은 SLM을 교사로 사용하여 AI 교육을 28% 더 빠르게 만들고 있습니다.

Google은 SLM을 교사로 사용하여 AI 교육을 28% 더 빠르게 만들고 있습니다.

훈련 대규모 언어 모델(LLM) 대부분의 조직에서는 접근이 불가능해졌습니다. 수백만 달러에 달하는 비용과 슈퍼컴퓨터를 힘들게 만드는 컴퓨팅 요구 사항으로 인해 AI 개발은 거대 기술 기업의 문 뒤에 갇혀 있었습니다. 그러나 구글은 너무나 단순한 접근 방식으로 이 이야기를 뒤집어 놓았습니다. 왜 아무도 더 일찍 이 문제를 생각하지 않았는지 궁금할 것입니다. 즉, 더 작은 AI 모델을 교사로 사용하는 것입니다.

SALT 작동 방식: AI 모델 훈련을 위한 새로운 접근 방식

최근 ‘라는 제목의 연구 논문에서작은 도움이 큰 도움이 됩니다: 소규모 LM을 활용한 효율적인 LLM 교육,” Google Research와 DeepMind는 SALT(Small model Aided Large model Training)를 도입했습니다. 이는 LLM 교육에 대한 기존 접근 방식에 도전하는 새로운 방법입니다.

이 연구가 왜 중요한가요? 현재 대규모 AI 모델을 훈련하는 것은 누군가에게 특정 주제에 대해 알아야 할 모든 것을 한꺼번에 가르치려는 것과 같습니다. 이는 비효율적이고 비용이 많이 들며 대규모 컴퓨팅 리소스를 갖춘 조직으로 제한되는 경우가 많습니다. SALT는 혁신적이고 실용적인 2단계 교육 과정을 도입하는 다른 길을 택합니다.

SALT의 실제 작동 방식을 분석하면 다음과 같습니다.

1단계: 지식 증류

2단계: 자기 지도 학습

비기술적인 용어로 말하자면,더 작은 AI 모델은 훈련 초기 단계에서 더 큰 모델을 안내하는 유용한 교사와 같다고 상상해 보세요. 이 교사는 답변과 함께 추가 정보를 제공하여 각 답변에 대해 얼마나 확신하는지를 나타냅니다. “소프트 라벨”이라고 알려진 이 추가 정보는 더 큰 모델이 더 빠르고 효과적으로 학습하는 데 도움이 됩니다.

이제 더 큰 AI 모델의 성능이 향상됨에 따라 교사에게 의존하는 것에서 독립적으로 학습하는 것으로 전환해야 합니다. 여기서 “선형 붕괴”와 “선형 비율 붕괴”가 작용합니다.
이러한 기술을 시간이 지남에 따라 교사의 영향력을 점차적으로 줄이는 것으로 생각하십시오.
두 기술의 목표는 더 큰 AI 모델의 원활한 전환을 보장하여 학습 동작의 갑작스러운 변화를 방지하는 것입니다.

결과는 설득력이 있습니다. Google 연구원들이 15억 개의 매개변수 SLM을 사용하여 SALT를 테스트하여 28억 개의 매개변수 LLM을 훈련시켰을 때 더미 데이터세트그들은 다음을 보았습니다:

그러나 SALT를 진정으로 혁신적으로 만드는 것은 이론적 프레임워크입니다. 연구원들은 “약한” 교사 모델이라도 소위 “유리한 편향-분산 균형”을 달성함으로써 학생의 성과를 향상시킬 수 있다는 사실을 발견했습니다. 간단히 말해서, 작은 모델은 큰 모델이 기본 패턴을 더 효율적으로 학습하도록 도와 고급 학습을 위한 더 강력한 기반을 마련합니다.

SALT가 AI 개발 경쟁의 장을 재구성할 수 있는 이유

클라우드 컴퓨팅이 변화했을 때 누가 기술 회사를 시작할 수 있었는지 기억하십니까? SALT는 AI 개발에도 동일한 작업을 수행할 수 있습니다.

저는 수년 동안 AI 교육 혁신을 지켜봐 왔으며 대부분의 혁신은 주로 거대 기술 기업에 도움이 되었습니다. 하지만 SALT는 다릅니다.

이것이 미래에 의미하는 바는 다음과 같습니다.

자원이 제한된 조직의 경우:

AI 개발 환경의 경우:

이것이 미래에 의미하는 바

작은 모델을 교사로 사용함으로써 우리는 AI 훈련을 더욱 효율적으로 만들 뿐만 아니라 AI 개발에 참여하는 사람을 근본적으로 변화시키고 있습니다. 그 의미는 단순한 기술적 개선 그 이상입니다.

명심해야 할 주요 사항:

주의할 점:

    맞춤형 AI 모델 개발을 시작하는 소규모 조직을 주시하세요.
  1. 이전에는 AI 개발을 감당할 수 없었던 분야의 새로운 애플리케이션을 살펴보세요.
  2. 특수 작업에 더 작은 모델을 사용하는 방법에 대한 혁신을 찾아보세요

기억하다: SALT의 진정한 가치는 AI에서 혁신을 이룰 수 있는 사람을 어떻게 바꿀 수 있는지에 있습니다. 연구실을 운영하든, 기술팀을 관리하든, AI 개발에 관심이 있든, 이는 차세대 아이디어를 실현할 수 있는 일종의 혁신입니다.

어쩌면 당신이 도달할 수 없다고 생각했던 AI 프로젝트에 대해 생각해 보기 시작할 수도 있습니다. 상상했던 것보다 더 가능성이 높을 수도 있습니다.

게시물 Google은 SLM을 교사로 사용하여 AI 교육을 28% 더 빠르게 만들고 있습니다. 처음 등장한 Unite.AI.

Exit mobile version