AI 뉴스허브

NVIDIA는 GPU 운전자의 과열 문제에 대한 핫픽스를 발행합니다

NVIDIA는 GPU 운전자의 과열 문제에 대한 핫픽스를 발행합니다

NVIDIA는 GPU 운전자의 과열 문제에 대한 핫픽스를 발행합니다

어제 Nvidia는 시스템이 안전한 GPU 온도를 잘못보고하여 AI 및 게임 커뮤니티 전반에 경보를 유발 한 이전 드라이버 릴리스에서 낙진을 포함하기 위해 중요한 핫픽스를 서두르고 있습니다.

Nvidia의 공식 우편 HOTFIX 릴리스 주변에서 명시된 수정 목록에서 3 분의 1에 불과하지만 문제는 ‘로 인용됩니다.’GPU 모니터링 유틸리티는 PC가 잠에서 깨어 난 후 GPU 온도보고를 중단 할 수 있습니다. ‘.

영향을받는 게임 준비 운전자 직후 576.02 롤아웃, a 고정 된 실 안정적인 확산 서브 레딧에서 제목이 있습니다 GPU를 저장하려면 읽으십시오!새로운 드라이버에 관한 일화 문제 및 사용자 보고서 업데이트의 리소스가되었습니다. 이들과 웹 주변의 다른 보고서에서 일대일의 긴급 문제가 수립 될 수 있습니다.

버그의 첫 번째 Reddit 보고서에는 발생했습니다 늦은 금요일 오후 UTC, ZephyrusG14 Subreddit에서 사용자 Fricy81이 인용했습니다. 우편 Nvidia 포럼에서 (보관 된) : :

NVIDIA 포럼의 사용자는 576.02 업데이트 이후 문제를 찾습니다. 출처 : https://www.nvidia.com/en-us/geforce/game/game-ready-drivers/13/563010/geforce grd-57602-20—thread-released-41625/3524072/

NVIDIA Forums의 사용자는 드라이버 업데이트를 설치 한 후 MSI 애프터 버너 및 게임 내 모니터와 같은 도구가 의무의 전화 (일반적으로 작업 관리자의 GPU 패널이 Windows에서 수행하는 것처럼 기본 시스템 판독 값에 액세스) GPU 온도 판독 업데이트를 중단하고 약 35-36 ° C에서 동결되었습니다.

모니터링 소프트웨어를 다시 시작하는 데 영향을 미치지 않았으며, 사용자는 전체 시스템 재부팅 만 정확한 판독 값을 복원 할 것이라고 밝혔다. HWINFO 및 NVIDIA의 자체 모니터링 앱과 같은 도구는 온도를 올바르게보고했습니다. 사용자는 수면에서 시스템을 깨우고 나서뿐만 아니라 정상적인 사용 중에 문제가 발생했다고 강조했다.

다양한 포럼에서의 사용자 피드백은 정상적인 팬 곡선 동작의 일반적인 중단과 코어 열 조절의 변화를 강조하여 그래픽 처리 장치가 예기치 않게 고온에서 공전하고, 상세한 표준 운영 부하로 간주되는 것 아래에서 놀라 울 정도로 과열되었습니다. 이 의견에서:

‘뭔가 꺼져 있다고 말할 수있었습니다. 외부의 날씨는 아마도 약 55 ° F / 12 ° C 였지만 방에서 요리를하고있었습니다. 내 창문이 열려 있었지만 아무런 차이도 느낄 수 없었습니다. 모든 팬들은 Max에서 달리고 있었고, Temps는 처음에는 68 ° C ~ 72 ° C에 걸쳐 한동안 잘 보였습니다.

‘처음에는 정상적인 것처럼 보였습니다. 다음날 아침, 내가 유휴 온도가 아니라는 것을 깨달았고 팬들은 여전히 [kicking].

‘최근 몇 가지를 고치고 나서 AI 오버 클로킹을 했으므로 값이 너무 높아 졌는지 확신하지 못했습니다. ASUS AI Suite 3을 설치 한 후 한 번 전에 발생했습니다. BIOS 설정은 제대로 작동하지 않습니다.

‘어쨌든, 나는 지금 나이가 많았다.

차선책

공식 릴리스 PDF 576.02의 경우 드라이버 업데이트는 새로운 문제에 기여했을 수있는 변경 사항에 대한 단서를 제공합니다. 5.5 절에서 NVIDIA는 NVIDIA에서 GPU 온도가 잘못보고 될 수 있음을 인정합니다. 옵티머스 시스템, 특히 응용 프로그램이 실행되지 않을 때는 0도를 보여줍니다.

공식 576.02 업데이트 노트의 섹션 5.5는 Optimus 시스템보다 더 많은 수의 시스템에 영향을 미친 것으로 보이는 온도 모니터링 문제를 해결합니다. 출처 : https://us.download.nvidia.com/windows/576.02/576.02-win11-win10-release-notes.pdf

릴리스 상태 :

5.5 GPU 온도는 Optimus 시스템에서 잘못보고되었습니다

5.5.1 문제

Optimus 시스템에서 Speccy 또는 GPU-Z와 같은 온도보고 도구는 응용 프로그램이 실행되지 않을 때 NVIDIA GPU 온도가 0이라고보고합니다.

5.5.2 설명

옵티머스 시스템에서 NVIDIA GPU를 사용하지 않을 때는 저전력 상태에 넣습니다. 이로 인해 온도보고 도구가 잘못된 값을 반환합니다. GPU를 깨우기 위해 온도를 쿼리하면 GPU 온도가 결과적으로 변하기 때문에 무의미한 측정이 발생합니다.

이 도구는 GPU가 깨어나고 실행될 때만 정확한 온도를보고합니다.

NVIDIA OPTIMUS는 배터리 수명을 보존하고 전력 소비를 줄이기 위해 설계된 성능과 전력 소비를 자동으로 균형을 맞추기 위해 응용 프로그램 요구에 따라 통합 및 개별 그래픽을 전환하는 GPU 스위칭 기술입니다. 게임 또는 HD 비디오 재생과 같은 작업의 경우 Optimus가 더 나은 성능을 위해 개별 GPU를 활성화합니다. 웹 브라우징과 같은 가벼운 활동 중에 통합 (온보드) 그래픽으로 되돌아갑니다.

이 업데이트는 이전에 옵티머스 시스템으로 제한된 동작을 확장 한 것으로 보이며, 영향을받는 GPU가 옵티머스 시스템에서 호스팅되지 않더라도 타사 도구에서 온도보고를 방해 할 때 유휴 상태에서 저전력 상태에 들어갈 수있는 것으로 보입니다.

위험 조정

대부분의 시나리오에서 그래픽 카드가 vbios 영구적 인 GPU 손상을 방지했을 것입니다. VBIOS는 드라이버와 독립적으로 펌웨어 수준에서 열 및 전력 제한을 시행합니다.

따라서 드라이버가 부적절한 팬 동작이나 잘못된보고 온도를 유발하더라도 VBIO는 여전히 성능을 스로틀, 팬 활동을 증가 시키거나 GPU를 종료하여 하드웨어 고장을 방지해야합니다.

그렇다고 위험이 사소한 것을 의미하지는 않습니다. 지속적인 고온은 시간이 지남에 따라 성능을 저하시킬 수 있습니다. 스트레스 인접 구성 요소; 또한 업데이트 된 드라이버가 문제를 일으켰다는 일반적인 이해가 없다는 사실 (드라이버가 ‘조용히’업데이트하는 시스템에서)을 일으켰습니다. 이러한 특성의 문제는 영향을받지 않는 사용자의 많은 비율을 오도 할 수 있으며, 이는 존재하지 않는 문제에 대한 구제책을 시도하거나 잠재적으로 비 관련 ‘수정 사항’을 적용하여 시스템을 손상시킬 수 있습니다.

업데이트 576.02로 인한 잘못된 행동은 특히 고성능 하드웨어가 일상적으로 확장 된 기간에 대한 열 제한으로 밀리는 인공 지능 워크 플로우에 관여하는 사람들에게는 특히 놀라운 행동이었습니다.

문제가있는 576.02 드라이버는 초기에도 4 월 중순에 출시 된 후 더 넓은 불만에 영감을주었습니다. 보고서 그것은 유익한 성능 개선을 제공했다. 핫픽스 제공과 576.02가 발생한 것으로 보이는 혼란 수준에도 불구하고 글을 쓰는 시점에 남아 있습니다. 다운로드 할 수 있습니다* Nvidia 사이트에서.

잔광

결함이있는 업데이트의 낙진과 관련하여, 수많은 유형의 손상 및 불편 함이보고된다 : 사용자 Frankie_T9000. 보고 된 결함 업데이트 하에서 열 축적으로 인해 그의 GPU가 부팅에 충돌했으며, 저하 후에 만 ​​안정화되었습니다. 그는 댓글을 달았다 ‘영구적으로 피해를 입지는 않았지만 최대한 빨리 재발해야합니다 (수요일에 나오는 패드가 있습니다)는 오래된 열 페이스트가 열 축적에 의해 더 많은 노화되었다고 의심하므로 새로운 페이스트 패드를 넣습니다.

어제 같은 스레드의 다른 사용자 정해진: ‘MSI Afterburner의 맞춤형 팬 곡선을 사용하고 있으며 GPU 온도가 지속적으로 27 ° C에 있음을 보여 주므로 팬이 켜지지 않아 과열 문제가 발생했습니다. 나는 그것이 ME 문제라고 생각했지만 이전 드라이버를 설치 한 후에는 모두 다시 잘 작동했습니다. 또한, TOBSEMANGER에서 온도가 올바르게 표시되었습니다. ‘

NVIDIA (각 HOTFIX 릴리스에서 지속적으로 상태로 표시)는 특정 비디오 게임 또는 플랫폼에 대한 핫픽스를 제공하지만 GPU에 대한 열 손상의 위험은 비디오 측정 업체보다 AI 실무자에게 더 높습니다. 교육과 같은 집중적 인 기계 학습 프로세스가 GPU를 유지하기 때문입니다. 일관된 장기 부하에 따라 -게임에서만 주기적으로 유발 될 가능성이있는 이벤트는 보스 배설물 또는 특히 까다로운 맵 섹션에 대해 높은 사용으로 ‘스파이크’할 수 있지만 GPU 악용과 시스템 안정성 사이의 타협으로 설계되었습니다.

* 아카이브 : https://archive.ph/ylvr1

2025 년 4 월 22 일 화요일에 처음 출판되었습니다

게시물 NVIDIA는 GPU 운전자의 과열 문제에 대한 핫픽스를 발행합니다 먼저 나타났습니다 Unite.ai.

Exit mobile version