모든 비즈니스에 대한 맞춤형 LLM? Deepseek은 우리에게 길을 보여줍니다

Date:

옛날 옛적에 Tech Clarion Call은“모두를위한 핸드폰” – 실제로 이동 통신은 비즈니스 (및 세계)에 혁명을 일으켰습니다. 오늘날 그 전화와 동등한 것은 모든 사람이 액세스 권한을 부여하는 것입니다. AI에 응용 프로그램. 그러나 AI의 진정한 힘은 비즈니스 및 조직의 특정 요구에 따라이를 활용하는 것입니다. 중국의 스타트 업에 의해 타오르는 길은 DeepSeek가 특정 요구를 충족시키기 위해 AI가 실제로 제한된 예산을 가진 사람들이 AI를 실제로 활용할 수있는 방법을 보여줍니다. 실제로 저렴한 AI의 출현은 비용 요구 사항으로 인해 많은 소규모 비즈니스 및 조직에서 종종 눈에 띄지 않는 AI 솔루션의 깊이있는 패턴을 바꾸겠다고 약속합니다.

llms는 – 또는 – a 고가의 노력대량의 데이터에 대한 액세스가 필요하고, 데이터를 처리하기 위해 많은 수의 강력한 컴퓨터, 모델 교육에 투자 한 시간과 리소스. 그러나 이러한 규칙은 바뀌고 있습니다. Shoeastring 예산으로 운영되는 DeepSeek은 자체 LLM 및 쿼리 유형의 쿼리 애플리케이션을 개발했습니다. DeepSeek의 접근 방식은 수십억 달러를 지출하지 않는 소규모 조직의 LLM 개발에 대한 창을 열어줍니다. 실제로, 대부분의 소규모 조직이 자신의 LLM을 개발하여 자신의 특정 목적을 제공 할 수있는 날은 그리 멀지 않을 수 있으며, 일반적으로 Chatgpt와 같은 일반적인 LLM보다 더 효과적인 솔루션을 제공합니다.

하는 동안 토론 Deepseek의 실제 비용에 비해 여전히 남아 있습니다. 단순히 그것을 설정하는 비용과 유사한 모델을 차별화하는 비용은 아닙니다. 그것은 덜 고급 칩과 훈련에 대한보다 집중된 접근 방식에 의존한다는 사실입니다. 미국 수출 제한에 따라 중국 회사로서 DeepSeek은 액세스 할 수 없었습니다. 고급 Nvidia 칩 LLM 개발에 필요한 중세 컴퓨팅에 일반적으로 사용되므로 사용해야합니다. 덜 강력한 Nvidia H-800 칩데이터를 빠르거나 효율적으로 처리 할 수 ​​없습니다.

그 권력 부족을 보상하기 위해 DeepSeek는 LLM 개발에 대해 더 집중하고 직접적인 접근 방식을 취했습니다. DeepSeek은 모델에 데이터 산을 던지고 데이터를 레이블링하고 적용하기 위해 계산 강도에 의존하는 대신 교육을 좁혔습니다. 소량의 고품질 “콜드 스타트”데이터를 사용합니다 그리고 IRL (적용) (반복 강화 학습알고리즘이 다른 시나리오에 데이터를 적용하고 학습을 통해). 이 집중된 접근 방식을 통해 모델은 실수가 적고 컴퓨팅 낭비가 적어 더 빠르게 학습 할 수 있습니다.

부모가 아기의 구체적인 움직임을 안내하는 방법과 마찬가지로, 아기가 처음으로 성공적으로 롤오버하도록 도와 주거나, 아기를 혼자서 알아 내지 못하게하거나, 이론적으로 롤오버에 도움이 될 수있는 더 넓은 움직임을 가르치는 대신, 더 집중된 AI 모델을 훈련시키는 데이터 과학자들은 특정 과제와 결과에 가장 도움이되는 것들을 훈련시킵니다. 이러한 모델은 Chatgpt와 같은 더 큰 LLM만큼 신뢰할 수있는 응용 프로그램만큼 광범위하지는 않지만 특정 응용 프로그램에 의존하고 정밀도와 효율성으로 수행 할 수 있습니다. Deepseek의 비평가조차도 개발에 대한 간소화 된 접근 방식이 효율성을 크게 증가시켜 훨씬 더 적은 결과를 얻을 수 있음을 인정합니다.

이 접근법은 AI에게 최상의 입력을 제공하므로 가장 똑똑하고 가장 효율적인 방법으로 이정표에 도달 할 수 있으며 특정 요구와 작업을 위해 LLM을 개발하려는 모든 조직에게 가치가있을 수 있습니다. 이러한 접근 방식은 소기업 및 조직에 점점 더 가치가 있습니다. 첫 번째 단계는 올바른 데이터로 시작하는 것입니다. 예를 들어, AI를 사용하여 영업 및 마케팅 팀이 영업 대화, 전략 및 메트릭을 연마하는 신중하게 선택된 데이터 세트에서 모델을 교육 해야하는 회사는 모델을 교육해야합니다. 이로 인해 모델이 관련이없는 정보에 시간을 낭비하고 전력을 계산하지 못하게합니다. 또한 교육은 단계적으로 구성되어야하므로 다음 작업으로 이동하기 전에 모델이 각 작업 또는 개념을 마스터하도록합니다.

몇 달 전에 어머니가 된 이후로 나 자신을 배웠기 때문에 이것은 또한 아기를 키우는 것과 유사합니다. 두 시나리오 모두에서, 가이드의 단계별 접근 방식은 자원을 낭비하지 않고 마찰을 줄입니다. 마지막으로, 아기 인간과 AI 모델 모두와의 이러한 접근 방식은 반복적 인 개선을 초래합니다. 아기가 자라거나 모델이 더 많이 배우면 능력이 향상됩니다. 이는 실제 상황을 더 잘 처리하기 위해 모델을 개선하고 개선 할 수 있음을 의미합니다.

이 접근 방식은 비용을 절감하여 AI 프로젝트가 자원 배수구가되지 않도록하여 소규모 팀과 조직에 더 접근 할 수 있도록합니다. 또한 AI 모델의 성능이 향상됩니다. 또한 모델은 외부 데이터로 과부하되지 않기 때문에 새로운 정보와 변화하는 비즈니스 요구에 적응하도록 조정할 수도 있습니다 – 경쟁력있는 시장의 핵심.

Deepseek의 도착과 저비용, 더 효율적인 AI의 세계 – 처음에는 AI 세계와 주식 시장 전체에 공황이 퍼지지 만 AI 부문의 전반적으로 긍정적 인 발전입니다. AI의 효율성과 비용이 크게 증가하면 최소한 특정 집중 응용 프로그램의 경우 궁극적으로 AI를 더 많이 사용하여 개발자에서 다람쥐에 이르기까지 모든 사람의 성장을 이끌어냅니다. 실제로 DeepSeek가 설명합니다 Jevons 역설 – 더 많은 효율성이 더 많은 경우 자원을 더 많이 사용하게 될 것입니다. 이러한 추세가 계속 될 것으로 보이면 AI를 사용하여 특정 요구를 충족시키는 데 중점을 둔 소규모 비즈니스도 성장과 성공을 위해 더 잘 설정 될 것입니다.

게시물 모든 비즈니스에 대한 맞춤형 LLM? Deepseek은 우리에게 길을 보여줍니다 먼저 나타났습니다 Unite.ai.

Share post:

Subscribe

Popular

More like this
Related

CMR 수술은 미국 전역에서 Busius Robot Access를 확장하기 위해 2 억 달러를 모금합니다.

미국에서는 22 세 이상의 성인 환자에게 versius 수술 시스템이...

2025 년 로봇 정상에서 물리 지능의 시대를 입력하십시오.

큰 언어 모델과 생성 AI가 증가함에 따라 연구원들은 지난...

이 알파벳 스핀 오프는 양식에 “어류 인식”을 제공합니다

견고한 깊이 노르웨이의 피요르드 인 우리 팀은 바닷물로 가득...

2025 년 AI 상태를 설명하는 12 개의 그래프

AI에 대한 뉴스를 읽으면 상충되는 메시지에 충격을받을 수 있습니다....