소개와 진화 생성 AI 갑자기 갑자기 강해서 실제로이 기술이 우리의 삶을 얼마나 많이 변화 시켰는지 완전히 이해하기가 매우 어렵습니다.
불과 3 년 전으로 확대됩니다. 예, AI는 적어도 이론적으로는 더욱 광범위 해지고있었습니다. AI의 능력에 대한 엄청난 오해가 있었음에도 불구하고 더 많은 사람들이 그것이 할 수있는 일들 중 일부를 알고있었습니다. 어떻게 든 기술은 동시에 제공되었다. 그럼에도 불구하고, 평범한 사람은 AI가 일하고있는 최소한 한두 분야를 가리키며 고도로 전문화 된 작업을 수행 할 수 있습니다. 충분히 좋게고도로 통제 된 환경에서. 그 이상은 여전히 연구 실험실에 있거나 단순히 존재하지 않았습니다.
오늘과 비교하십시오. 문장을 쓰거나 질문을하는 능력 이외의 기술이없는 세상은 우리의 손가락에 있습니다. 우리는 정말 독특하고 놀라운 이미지, 음악 및 영화를 생성 할 수 있으며 전체 산업을 방해 할 수있는 기능을 가질 수 있습니다. 우리는 검색 엔진 프로세스를 슈퍼 충전하여 프레임이 올바른 경우 대학 훈련을받은 학자로 전달하기에 충분한 맞춤형 컨텐츠 페이지를 생성 할 수 있다는 간단한 질문을 할 수 있습니다. 어쨌든 그들은 단 1 년 또는 2 년 만에 평범 해지지만,이 기능은 몇 년 전만해도 불가능한 것으로 간주되었습니다. 생성 AI의 분야는 존재했지만 어떤 방법으로도 이륙하지 않았습니다.
오늘날 많은 사람들이 Chatgpt, Midjourney 또는 기타 도구와 같은 생성 AI를 실험했습니다. 다른 사람들은 이미 일상 생활에 포함 시켰습니다. 이것들이 진화 한 속도는 거의 놀라운 시점까지 물집이 있습니다. 그리고 지난 6 개월의 발전을 감안할 때, 우리는 향후 몇 년 동안 계속해서 날아갈 것입니다.
생성 AI 내에서 플레이 할 때의 특정 도구 중 하나는 RAG (Retrieval-Augmented Generation) 시스템의 성능과 특히 복잡한 쿼리를 통해 생각할 수있는 능력이었습니다. 의 소개 프레임 데이터 세트, AN 내에서 자세히 설명합니다 기사 평가 데이터 세트의 작동 방식에 따라 예술의 상태가 현재 위치와 어디로 향하는지를 보여줍니다. 2024 년 후반에 프레임이 도입 된 이후에도, 다수의 플랫폼은 이미 어렵고 복잡한 쿼리를 통해 추론 할 수있는 능력에 대한 새로운 기록을 끊었습니다.
어떤 프레임이 평가하기위한 것인지, 생성 AI 모델이 얼마나 잘 수행되는지에 대해 알아 봅시다. 우리는 탈 중앙화와 오픈 소스 플랫폼이 어떻게 자신의 입장을 유지하는지 알 수 있습니다 (특히 지각 채팅), 그들은 사용자가 일부 AI 모델이 달성 할 수 있다는 놀라운 추론을 명확하게 엿볼 수 있도록 허용하고 있습니다.
Genai 뇌의 창으로 프레임
프레임 데이터 세트와 평가 프로세스는 추론, 논리적 연결 도트, 주요 정보를 검색하기 위해 여러 가지 소스를 사용하고 논리적으로 함께 결합하여 질문에 대답 할 수있는 능력에 중점을 둡니다. 질문은 2 ~ 15 개의 문서 사이에 올바르게 답변하고 의도적으로 제약, 수학적 계산 및 공제, 시간 기반 논리를 처리하는 능력을 포함합니다. 다시 말해, 이러한 질문은 매우 어렵고 실제로 인간이 인터넷에서 수행 할 수있는 실제 연구 집안을 나타냅니다. 우리는 이러한 과제를 항상 다루며 인터넷 소스의 바다에서 흩어진 주요 정보를 검색하고, 다른 사이트를 기반으로 정보를 결합하고, 이러한 사실을 계산하고 추론하고 이러한 사실을 질문의 정답으로 통합하는 방법을 이해하여 새로운 정보를 만들어냅니다.
데이터 세트가 처음 출시되고 테스트되었을 때 연구원들이 찾은 것은 유전자 모델 단일 단계 방법을 사용하여 대답해야 할 때 다소 정확할 수 있었지만 질문에 답변하기 위해 필요한 모든 문서를 수집 할 수있는 경우 73% 정확도를 달성 할 수있었습니다. 그렇습니다. 73%는 혁명처럼 보이지 않을 수 있습니다. 그러나 대답해야 할 내용을 정확하게 이해하면 숫자가 훨씬 더 인상적입니다.
예를 들어, 한 가지 특별한 질문은 다음과 같습니다.“원래 Kanye West의 Song Power Born에서 샘플링 된 노래를 공연 한 그룹의 밴드 리더는 몇 년입니까?” 인간은이 문제를 해결하는 방법은 무엇입니까? 그 사람은 “Power”라는 Kanye West 노래의 가사와 같은 다양한 정보 요소를 수집 한 다음 가사를 살펴보고 실제로 다른 노래를 샘플링하는 노래의 요점을 식별 할 수 있습니다. 인간으로서 우리는 아마도 노래를들을 수 있으며 (그 노래에 익숙하지 않더라도) 다른 노래가 샘플링 될 때를 알 수 있습니다.
그러나 그것에 대해 생각하십시오 : Genai는 원본 이외의 노래를 감지하기 위해 무엇을 성취해야합니까? 이것은 기본적인 질문이 진정으로 지능적인 AI의 훌륭한 테스트가되는 곳입니다. 그리고 우리가 노래를 찾고, 듣고, 샘플링 된 가사를 식별 할 수 있다면, 1 단계입니다. 우리는 여전히 노래의 이름이 무엇인지, 밴드의 지도자, 그 밴드의 리더가 누구인지, 그 사람이 태어난 해를 찾아야합니다.
프레임은 현실적인 질문에 대답하기 위해서는 엄청난 양의 사고 처리가 필요하다는 것을 보여줍니다. 여기서 두 가지가 떠 오릅니다.
첫째, 능력 분산 Genai 모델은 경쟁 할뿐만 아니라 결과를 잠재적으로 지배하는 모델은 놀랍습니다. 점점 더 많은 회사가 분산 된 방법을 사용하여 처리 능력을 확장하고 있으며 대규모 커뮤니티가 소프트웨어를 소유하고 있으며, 이는 고급을 공유하지 않는 중앙 집중식 블랙 박스가 아닙니다. Perplexity 및 Sensient와 같은 회사는 이러한 추세를 이끌고 있으며, 각각 프레임이 출시 될 때 첫 번째 정확도 기록을 수행하는 강력한 모델이 있습니다.
두 번째 요소는 이러한 AI 모델의 소수가 분산 될뿐만 아니라 오픈 소스라는 것입니다. 예를 들어, Sentient Chat은 모두 귀중한 오픈 소스 액세스로 인해 추론이 얼마나 복잡 할 수 있는지를 보여줍니다. 위의 프레임 질문은 인간이 사용할 수있는 동일한 사고 과정을 사용하여 응답하며, 추론 세부 사항은 검토 할 수 있습니다. 아마도 더 흥미로운 것은 일부 Genai 모델의 미세 조정 프로세스가 정확도가 떨어지더라도 주어진 관점과 성능을 미세 조정할 수있는 여러 모델로 구성되어 있습니다. 지각 채팅의 경우 많은 모델이 개발되었습니다. 예를 들어, “Dobby 8B”라는 최근 모델은 프레임 벤치 마크를 능가 할 수 있지만, 정보 조각을 처리하고 답을 개발할 때 모델의 관점에 영향을 미치는 독특한 프로 크립토 및 프로 프리드 태도를 개발할 수 있습니다.
수평선에
이 놀라운 혁신의 핵심은 우리를 여기로 데려온 빠른 속도입니다. 우리는이 기술이 진화 한 것만 큼 빨리 진화 할 때 가까운 시일 내에 더 빨리 진화 할 것임을 인정해야합니다. 우리는 특히 탈 중앙화 및 오픈 소스 Genai 모델, 시스템의 지능이 점점 더 많은 것을 초과하기 시작하는 중요한 임계 값과 미래에 대한 의미를 볼 수 있습니다.
게시물 LLM이 실제로 지저분한 문제를 통해 얼마나 잘 추론 할 수 있습니까? 먼저 나타났습니다 Unite.ai.