NVIDIA Edify 디코딩 – 개발자가 자신의 데이터로 훈련된 사용자 정의 모델을 만드는 데 도움이 되는 기술

Date:

편집자 주: 이 게시물은 다음의 일부입니다. AI 디코드 시리즈이 행사에서는 AI 기술을 보다 쉽게 ​​접근 가능하게 만들어 AI에 대한 이해를 높이고 RTX PC 사용자를 위한 새로운 하드웨어, 소프트웨어, 도구 및 가속 기능을 선보입니다.

언어, 2D 이미지, 3D 모델 또는 비디오를 제작하는 콘텐츠 생성기는 창의적인 커뮤니티에 비전을 더욱 빠르게 실현할 수 있는 도구를 제공합니다.

개발자가 이러한 새로운 생성 AI 도구를 구축할 수 있도록 NVIDIA는 다음과 같이 설정했습니다. 엔비디아 AI 파운드리. 이를 통해 기업은 자체 라이선스 데이터를 사용하여 생성 AI 모델을 훈련할 수 있습니다. 엔비디아 에디파이간단한 텍스트 프롬프트를 사용하여 이미지, 비디오, 3D 자산, 360도 고동적 범위 이미징 및 물리 기반 렌더링(PBR) 소재를 생성할 수 있는 멀티모달 AI 아키텍처입니다. AI Foundry를 사용하면 기업은 이러한 자산을 생성하기 위해 맞춤형 AI 모델을 훈련할 수 있습니다.

Edify의 핵심 요소로는 다양한 유형의 콘텐츠를 생성하는 기능, 적은 수의 이미지로 학습하면서도 고품질 콘텐츠를 제작할 수 있게 해주는 뛰어난 학습 효율성, 스타일을 맞추거나 문자나 객체를 학습하도록 모델을 미세 조정할 수 있는 기능 등이 있습니다.

NVIDIA AI Foundry 및 Edify를 기반으로 구축된 서비스의 가장 좋은 예 중 하나는 다음과 같습니다. Getty Images의 생성 AI상업적으로 안전한 생성 사진 서비스입니다. AI Foundry와 Edify의 조합을 통해 사용자는 훈련 데이터 세트를 제어하여 필요에 맞는 모델을 만들 수 있습니다.

저작권 문제를 피하기 위해 Getty Images는 Edify를 사용하여 자체 라이선스 콘텐츠에 대한 서비스를 훈련하여 데이터 세트에 유명 인물이나 제품이 없도록 했습니다. 이 회사는 또한 수익의 일부를 기여자와 공유하여 모델에 기여하는 크리에이터에게 새로운 수익원을 제공합니다.

Edify를 사용한 자산 생성

Edify는 이미지, 3D 자산, 360도 HDRi 환경 맵을 포함한 다양한 이미지 유형을 생성하도록 훈련될 수 있습니다.

Edify Image는 약 6초 만에 4개의 고품질 1K 이미지를 생성할 수 있어 이전 모델의 성능을 두 배로 높였습니다. 또한 이미지를 추가 세부 정보를 추가하는 생성형 업스케일러로 4K로 변환할 수도 있습니다.

Getty Images 4K 이미지는 상업적으로 안전한 크리에이티브 라이브러리를 사용하여 NVIDIA Edify에서 학습되었습니다.

이미지는 고급 프롬프트 준수, 초점 거리 또는 피사계 심도를 지정하는 카메라 컨트롤, 생성을 안내하는 ControlNets 덕분에 매우 제어하기 쉽습니다. ControlNets에는 사용자가 이미지 구성을 따라가거나 복사할 스케치를 제공할 수 있는 Sketch와 이미지 구성을 복사하는 Depth가 포함됩니다.

Edify Image로 이미지를 편집할 수도 있습니다. InPaint를 사용하면 사용자가 이미지에 콘텐츠를 추가하거나 수정할 수 있습니다. Replace(엄격한 InPaint)는 옷과 같은 세부 정보를 변경할 수 있습니다. 그리고 OutPaint는 이미지를 확장하여 다른 종횡비에 맞출 수 있습니다. 그리고 이 모든 것이 Segment로 간소화되었습니다. Segment는 텍스트 프롬프트만으로 객체를 마스크할 수 있는 기능입니다.

Edify는 아티스트가 사용할 수 있는 3D 메시도 만들 수 있습니다. 메시는 깨끗한 쿼드 기반 토폴로지, 최대 4K PBR 소재, 자동 UV 매핑을 제공하여 텍스처 편집을 더 쉽게 할 수 있습니다. 빠른 미리보기 모드는 단 10초 만에 결과를 제공하며, 이를 전체 3D 메시로 변환할 수 있습니다.

메시는 장면을 프로토타입화하거나, 세트 장식을 위한 배경 객체를 생성하거나, 3D 조각을 위한 시작점으로 삼는 데 적합합니다.

Edify 360 HDRi는 장면을 비추거나 반사하거나 배경으로 사용할 수 있는 자연 경관의 환경 맵을 생성합니다. 이 모델은 텍스트나 이미지 프롬프트에서 최대 16K HDRi 이미지를 생성할 수 있습니다. 원하는 백플레이트를 손에 넣으면 사용자는 몇 시간 동안 백플레이트를 찾는 대신 일치하는 사용자 지정 HDRi를 만들 수 있습니다.

텍스트 프롬프트를 기반으로 한 높은 동적 범위의 360도 파노라마.

Edify의 멀티모달 기능은 독특하여 다양한 자산 유형을 결합하는 고급 워크플로를 가능하게 합니다. 예를 들어 에이전트와 함께 사용하면 Edify를 사용하면 사용자가 간단한 텍스트 프롬프트로 몇 분 안에 전체 장면을 프로토타입으로 만들 수 있습니다. NVIDIA Research SIGGRAPH 데모 NVIDIA Edify 기반 모델과 NVIDIA Omniverse 플랫폼의 보조적 3D 세계 구축 기능을 보여준 행사입니다.

또 다른 사용 사례는 Edify 3D와 360 HDRi를 Image와 결합하여 사용자에게 이미지 생성에 대한 완전한 제어권을 제공하는 것입니다. 3D로 장면을 생성함으로써 아티스트는 객체를 이동하고 원하는 샷을 프레이밍한 다음 Edify Image를 사용하여 프로토타입을 사실적인 이미지로 바꿀 수 있습니다.

Getty Images의 생성 AI

게티이미지는 최대 규모의 콘텐츠 서비스 공급업체이자 창의적인 비주얼, 편집 사진, 비디오 및 음악 공급업체 중 하나이며, 사람들이 세계 최고의 사진작가와 영상작가의 강력한 비주얼 콘텐츠를 발견하고 구매하고 공유하기 위해 가장 먼저 찾는 곳 중 하나입니다.

Getty Images는 NVIDIA AI Foundry를 사용하여 생성 AI 서비스를 구동하기 위해 NVIDIA Edify Image 모델을 훈련했습니다. 다음을 통해 사용 가능 Getty Images의 생성 AI 기업 및 iStock의 생성 AI 소규모 기업과 아마추어 창작자를 위해 이 서비스를 이용하면 NVIDIA Edify가 지원하는 모델을 사용하여 이미지를 생성하고 수정할 수 있습니다.

Getty Images(또는 iStock)의 Generative AI는 다양한 라이선스 콘텐츠를 제공합니다.

Getty Images와 iStock는 최근 Edify Image의 최신 버전으로 업데이트하여 더 빠른 생성과 더 빠른 응답성을 제공하고 카메라 컨트롤을 공개했습니다.

Getty Images의 Generative AI에서 카메라 컨트롤이 업데이트되었습니다.

이제 사용자는 사전 촬영된 크리에이티브 콘텐츠에서 생성 AI 도구를 사용하여 iStock의 비주얼 라이브러리를 편집하고 수정하여 콘텐츠를 빠르게 반복하고 완벽하게 만들 수 있습니다. 동일한 기능이 곧 다음에서도 제공됩니다. 게티이미지닷컴.

Getty Images에서 Generative AI를 테스트 드라이브하세요. ai.엔비디아닷컴.

생성적 AI는 모든 종류의 게임, 화상 회의 및 대화형 경험을 혁신하고 있습니다. 구독하여 새로운 소식과 다음 소식을 알아보세요. AI 디코드 뉴스레터.

Share post:

Subscribe

Popular

More like this
Related

12월23일 정부지원사업 신규 공고 리스트 (12건) _ (파일 재가공/재배포 가능)

12월 23일 12건<12/23지원사업 신규 공고 목록> *전 영업일인 12/20에 올라온...

Waste Robotics와 Greyparrot가 분류 로봇을 강화하는 방법

Waste Robotics는 FANUC 로봇 팔을 사용하여 안정적이고 정확한 피킹을...

2024년 상위 10가지 생물의학 이야기

2024년에는 생체 의학 기술이 실제로 우리 머리, 더 구체적으로...

Sora AI 리뷰: AI가 영상 제작자를 영원히 대체할 수 있을까요?

말로만 고품질 비디오를 만들고 싶었던 적이 있습니까?2024년 2월 OpenAI...