AlexNet 소스 코드는 이제 오픈 소스입니다

Date:

Computer History Museum은 Google과의 파트너십을 통해 2012 년에 AI에 대한 오늘날의 일반적인 접근 방식을 시작한 신경망 인 Alexnet에 소스 코드를 발표했습니다. 소스 코드는 오픈 소스 ON으로 제공됩니다 CHM의 Github 페이지.

Alexnet은 무엇입니까?

Alexnet은 사진 이미지의 내용을 인식하기 위해 생성 된 인공 신경망입니다. 2012 년 토론토 대학교 대학원생에 의해 개발되었습니다. Alex Krizhevsky 그리고 Ilya Sutskever 그리고 그들의 교수진 고문, Geoffrey Hinton.

딥 러닝의 기원

힌튼은 아버지 중 한 명으로 간주됩니다 딥 러닝사용하는 인공 지능의 유형 신경망 그리고 오늘날의 주류 AI의 기초입니다. 적응 형 중량 층이 단 하나만있는 간단한 3 층 신경망은 1950 년대 후반에 처음으로 코넬 연구원 인 Frank Rosenblatt에 의해 처음 구축되었지만 한계가있는 것으로 밝혀졌습니다.[의뜻[이 설명자 특히 신경망의 작동 방식에 대한 자세한 내용은 하나 이상의 적응 형 가중치를 가진 네트워크가 필요했지만이를 훈련시키는 좋은 방법은 없었습니다. 1970 년대 초, 신경망은 그랬습니다 크게 거부되었습니다 AI 연구원.

Frank Rosenblatt 박사와 Charles W. Wightman 박사의 흑백 사진 드라이버를 사용하여 전자 신경망의 프로토 타입 작업을 수행합니다.Frank Rosenblatt [left, shown with Charles W. Wightman] 1957 년 최초의 인공 신경망 인 Perceptron을 개발했습니다.희귀 및 원고 컬렉션/Cornell University Library의 부서

1980 년대에 신경망 연구는 캘리포니아 샌디에고 대학의인지 과학자들에 의해“연결주의”라는 새로운 이름으로 AI 커뮤니티 밖에서 부활했습니다. 박사 학위를 마친 후 1978 년 에딘버러 대학교에서 힌튼은 UCSD의 박사후 연구원이되어 협력했습니다. David Rumelhart 그리고 로널드 윌리엄스. 이 세 명은 신경망을 훈련하기위한 역전 알고리즘을 재발견했으며 1986 년에는 신경망이 언어 및 비전 작업에 대한 여러 층의 기능을 배울 수 있음을 보여주는 두 가지 논문을 발표했습니다. 오늘날 딥 러닝의 기초가되는 역전술은 현재 출력과 네트워크의 원하는 출력의 차이를 사용하여 각 층의 가중치를 입력 레이어에서 입력 계층으로 조정합니다.

1987 년 힌튼이 합류했습니다 토론토 대학교. 전통적인 AI의 중심에서 힌튼의 작품과 그의 대학원생들의 작품은 토론토를 앞으로 수십 년 동안 딥 러닝 연구의 중심으로 만들었습니다. 힌튼의 박사후 학생 얀 레 쿤이제 메타의 최고 과학자. 토론토에서 일하는 동안 Lecun은 역전술이 “컨볼 루션”신경망에서 사용될 때 필기 숫자를 인식하는 데 매우 능숙하다는 것을 보여주었습니다.

imagenet 및 gpus

이러한 발전에도 불구하고 신경망은 다른 유형의 기계 학습 알고리즘을 지속적으로 능가 할 수 없었습니다. 그들은 길을 열기 위해 AI 외부에서 두 가지 개발이 필요했습니다. 첫 번째는 웹을 통해 제공되는 훈련을위한 훨씬 더 많은 양의 데이터의 출현이었습니다. 두 번째는 GPU로 알려진 3D 그래픽 칩 형태 로이 교육을 수행하기에 충분한 계산 능력이었습니다. 2012 년에는 Alexnet에게는 시간이 잘 렸습니다.

Fei Fei Li는 이벤트에서 무대에서 Tom Kalil과 이야기합니다. 둘 다 팔 의자에 앉아 있습니다.2009 년에 완료된 Fei-Fei Li의 Imagenet Image DataSet은 Alexnet을 훈련시키는 데 중추적이었습니다. 여기, 리 [right] 컴퓨터 역사 박물관에서 Tom Kalil과 대화합니다.Douglas Fairbairn/컴퓨터 역사 박물관

Alexnet을 훈련시키는 데 필요한 데이터가 발견되었습니다 imagenet스탠포드 교수가 프로젝트를 시작하고 이끄는 프로젝트 Fei-Fei Li. 2006 년부터 기존의 지혜에 반하여 Li는 영어로 된 모든 명사를 다루는 이미지 데이터 세트를 구상했습니다. 그녀와 그녀의 대학원생들은 인터넷에서 발견 된 이미지를 수집하고 Wordnet단어의 데이터베이스와 서로의 관계. 그들의 임무의 거대함을 감안할 때 Li와 그녀의 공동 작업자는 궁극적으로 이미지를 공연 작업자에게 라벨링하는 작업을 사용하여 사용했습니다. 아마존의 기계식 터크 플랫폼.

2009 년에 완료된 ImageNet은 몇 배의 이전 이미지 데이터 세트보다 컸습니다. Li는 그 가용성이 새로운 혁신을 박차를 가하기를 바랐고 그녀는 경쟁 2010 년에 연구팀이 이미지 인식 알고리즘을 개선하도록 장려했습니다. 그러나 향후 2 년 동안 최고의 시스템은 한계 만 개선했습니다.

신경망의 성공에 필요한 두 번째 조건은 방대한 양의 계산에 대한 경제적 인 접근이었습니다. 신경망 훈련에는 많은 반복 된 매트릭스 곱셈이 포함되며, 바람직하게는 병렬로 수행되며 GPU가 설계된 것입니다. nvidiaCEO의 공동 Jensen Huang2000 년대에 3D 그래픽 이외의 응용 프로그램에 대해 GPU를보다 일반화하고 프로그래밍 할 수있는 방법을 이끌었습니다. CUDA 프로그래밍 시스템 2007 년에 출시되었습니다.

Imagenet과 Cuda는 신경망 자체와 마찬가지로 올바른 상황이 빛나기를 기다리는 상당히 틈새 개발이었습니다. 2012 년 Alexnet은 이러한 요소 (가파른 신경망, 대형 데이터 세트 및 GPU)를 처음으로 한 번의 결과로 모았습니다. 이들 각각은 다른 사람이 필요했습니다.

Alexnet이 만든 방법

2000 년대 후반, 토론토 대학의 힌튼의 대학원생들은 GPU를 사용하여 이미지와 음성 인식을 위해 신경망을 훈련시키기 시작했습니다. 그들의 첫 성공은 음성 인식에서 이루어졌지만 이미지 인식의 성공은 AI에 대한 가능한 일반적인 솔루션으로 딥 러닝을 지적 할 것입니다. 한 학생 인 Ilya Sutskever는 신경망의 성능이 이용 가능한 데이터의 양으로 확장 될 것이라고 믿었으며 Imagenet의 도착은 기회를 제공했습니다.

2011 년, Sutskever는 GPU에서 최대 성능을 짜는 능력을 가진 동료 대학원생 Alex Krizhevsky를 설득하여 Imernet을위한 컨볼 루션 신경 네트워크를 훈련시킬 수 있었으며 힌튼은 주요 수사관으로 봉사했습니다.

Jensen Huang은 이벤트 단계에서 연단 뒤에 말합니다. 그 뒤에는 그의 이름을 보여주는 프로젝터 화면과 그 아래에있는 문장과 함께 "컴퓨터 그래픽, 가속화 된 컴퓨팅 및 인공 지능을위한 장치 및 시스템의 발전에 대한 비전 리더십"이라는 문장이 있습니다.Alexnet은 imagenet 데이터 세트에서 훈련 된 Cuda 코드를 실행하는 NVIDIA GPU를 사용했습니다. Nvidia CEO Jensen Huang은 컴퓨터 그래픽 칩과 AI에 대한 그의 기여로 2024 CHM Fellow로 지명되었습니다.Douglas Fairbairn/컴퓨터 역사 박물관

Krizhevsky는 NVIDIA GPUS를 사용하여 Convolutional Neural Network에 대한 CUDA 코드를 이미 작성했습니다. Cuda-Convnet훨씬 더 작은 훈련 CIFAR-10 이미지 데이터 세트. 그는 여러 GPU 및 기타 기능을 지원하여 Cuda-Convnet을 확장하여 Imagenet에서 재교육했습니다. 교육은 부모님의 집에 Krizhevsky의 침실에 Nvidia 카드 2 개가있는 컴퓨터에서 이루어졌습니다. 내년 동안, 그는 네트워크의 매개 변수를 지속적으로 조정하고 경쟁 업체보다 우수한 성능을 달성 할 때까지 재교육을 회복했습니다. 네트워크는 궁극적으로 Krizhevsky 다음에 Alexnet으로 명명 될 것입니다. Geoff Hinton은 Alexnet 프로젝트를 이런 식으로 요약했습니다.“Ilya는 우리가해야한다고 생각했고 Alex는 작동했고, 나는 노벨상.”

Krizhevsky, Sutskever 및 Hinton은 a를 썼습니다 Alexnet에 종이 이는 2012 년 가을에 출판되었으며 10 월 이탈리아 피렌체에서 열린 컴퓨터 비전 컨퍼런스에서 Krizhevsky가 발표했습니다. 베테랑 컴퓨터 비전 연구원들은 확신하지 못했지만 회의에 참석 한 레쿤은이를 AI의 전환점으로 선언했습니다. 그는 옳았다. Alexnet 이전에, 주요 컴퓨터 비전 논문은 거의 신경망을 사용하지 않았습니다. 그 후, 거의 모든 것들이 그럴 것입니다.

Alexnet은 시작에 불과했습니다. 향후 10 년 동안, 신경망이 발전 할 것입니다 믿을만한 인간의 목소리를 종합합니다,,, 비트 챔피언 GO 선수그리고 작품을 생성하십시오2022 년 11 월 chatgpt의 출시와 함께 OpenaiSutskever가 공동 설립 한 회사.

AlexNet 소스 코드를 출시합니다

2020 년에 나는 Krizhevsky에게 연락하여 CHM이 역사적 중요성으로 인해 AlexNet 소스 코드를 공개 할 수있는 가능성에 대해 물었습니다. 그는 당시 Google에서 일하고 있던 Hinton과 나를 연결시켰다. Google은 Alexnet을 소유했으며, Hinton, Sutskever 및 Krizhevsky가 소유 한 Dnnresearch를 인수했습니다. Hinton은 CHM을 Google의 올바른 팀에 연결하여 공을 롤링했습니다. CHM은 5 년 동안 Google 팀과 협력하여 릴리스를 협상했습니다. 이 팀은 또한 Alexnet 소스 코드의 특정 버전을 릴리스 할 수 있도록 도와주었습니다. 수년 동안 Alexnet 버전이 많이 있습니다. Github에는 Alexnet이라는 코드의 다른 저장소가 있지만, 이들 중 다수는 원래 코드가 아닌 유명한 논문을 기반으로 재창조됩니다.

CHM은 소스 코드를 2012 버전의 Alexnet에 제시하여 인공 지능 분야를 변형시키는 것을 자랑스럽게 생각합니다. 소스 코드에 액세스 할 수 있습니다 CHM의 Github 페이지.

이 게시물은 원래에 나타났습니다 컴퓨터 역사 박물관의 블로그.

감사의 말

그의 견적을 제공하고 텍스트를 검토 한 Geoffrey Hinton에게 감사의 말을 전하고, 추가 설명을 위해 Cade Metz와 Alex Krizhevsky, David Bieber와 Google의 나머지 팀은 소스 코드 릴리스를 확보했습니다.

참조

Fei-Fei Li, 내가 본 세계 : AI의 새벽에서 호기심, 탐험 및 발견. 퍼스트 에디션, Flatiron Books, New York, 2023.

케이드 메츠, 천재 제작자 : AI를 Google, Facebook 및 The World에 가져온 Mavericks. 첫 번째 판, 펭귄 랜덤 하우스, 뉴욕, 2022.

Share post:

Subscribe

Popular

More like this
Related

4월 4일 정부지원사업 신규 공고 리스트 (106건) _ (파일 재가공/재배포 가능)

4월 4일 106건<4/4 지원사업 신규 공고 목록> *전 영업일인 4/3에...

미국 정부 정책 이동은 로봇 공학, 노트 패널리스트를위한 기회를 제공합니다.

생생한 행성은 토지 관리 및 화재 완화, 연방 정부의...

민첩성 로봇 공학은 Digit Humanoid의 최신 발전을 선보입니다

Digit Humanoid는 Promat 2025에서 최신 기능을 보여줍니다. 출처 :...

IEEE Education Week의 이벤트 가이드

기술이 발전함에 따라 최신 발전과 기술로 최신 상태를 유지하는...