이 미래지향적인 올림픽 영상이 생성 AI의 상태에 대해 말하는 것

Date:

지난달 파리 올림픽이 끝났고 패럴림픽이 아직 진행 중이므로 2028년 로스앤젤레스 하계 올림픽은 지금으로부터 평생 후의 일처럼 느껴집니다. 하지만 스포츠 엔터테인먼트계의 영화 제작자이자 르브론 제임스와 시카고 불스의 콘텐츠 제작에 참여한 조쉬 칸은 고향 도시에서 경기를 관람할 수 있다는 전망에 더 먼 미래를 생각하게 되었습니다. 3028년 LA 올림픽은 어떤 모습일까요?

AI 비디오 생성을 위한 완벽한 유형의 창의적 연습으로, 올해 초 OpenAI의 Sora가 출시되면서 주류가 되었습니다. Runway나 Synthesia와 같은 생성기에 프롬프트를 입력하면 사용자는 몇 분 안에 상당히 고화질 비디오를 생성할 수 있습니다. 빠르고 저렴하며 CGI나 애니메이션과 같은 기존 제작 기법에 비해 기술적 장애물이 거의 없습니다. 모든 프레임이 완벽하지 않더라도(손가락이 여섯 개 달린 손이나 사라지는 물체와 같은 왜곡이 일반적임) 적어도 이론상으로는 상업적으로 활용될 수 있는 분야가 많이 있습니다. 광고 대행사, 회사, 콘텐츠 제작자는 이 기술을 사용하여 빠르고 저렴하게 비디오를 만들 수 있습니다.

칸은 장난감 얼마 동안 AI 비디오 도구를 사용하여 최신 버전의 Runway를 사용하여 미래의 올림픽이 어떨지 꿈꾸며 각 샷에 대한 모델에 새로운 프롬프트를 입력했습니다. 이 비디오는 길이가 1분도 채 안 되며 해수면이 급격히 상승하여 도시가 해안선까지 꽉 차 있는 미래형 LA의 광활한 공중 전망을 제공합니다. 축구 경기장이 마천루 위에 자리 잡고 있고 항구 한가운데에 있는 돔에는 비치 발리볼 코트가 있습니다.

그만큼 동영상독점적으로 공유되었습니다 MIT 기술 리뷰,는 도시에 대한 로드맵이라기보다는 AI로 무엇이 가능한지 보여주는 데모에 가깝습니다.

“우리는 올림픽과 개최 도시의 문화적 스토리텔링에 얼마나 많은 신경을 쏟는지 지켜보았습니다.” 칸이 말했습니다. “로스앤젤레스에는 상상력과 스토리텔링의 문화가 있는데, 이는 전 세계의 분위기를 정해주었습니다. 1,000년 후 LA로 올림픽이 돌아온다면 어떤 모습일지 보여줄 수 있다면 멋지지 않을까요?”

무엇보다도 이 영상은 생성 기술이 창작자에게 얼마나 큰 도움이 될 수 있는지 보여줍니다. 그러나 또한 무엇이 그것을 가로막고 있는지도 보여줍니다. 칸은 촬영에 대한 프롬프트를 공유하거나 각 테이크를 제대로 찍는 데 얼마나 많은 프롬프트가 필요했는지 구체적으로 밝히기를 거부했지만, AI로 좋은 콘텐츠를 만들고자 하는 사람은 누구나 시행착오를 감수할 수 있어야 한다고 주의를 주었습니다. 그의 미래적 프로젝트에서 특히 어려웠던 것은 AI 모델이 건축 측면에서 상자 밖에서 생각하도록 하는 것이었습니다. 예를 들어, 물 위로 떠 있는 경기장은 대부분의 AI 모델이 훈련 데이터에서 많은 예를 본 적이 없는 것입니다.

각 샷마다 새로운 프롬프트 세트가 필요하기 때문에 비디오 전체에 걸쳐 연속성을 심어주는 것도 어렵습니다. 색상, 태양의 각도, 건물의 모양은 비디오 생성 모델이 일관되게 유지하기 어렵습니다. 또한 비디오에는 사람의 클로즈업이 전혀 없는데, 칸은 AI 모델이 여전히 어려움을 겪는다고 말합니다.

“이러한 기술은 현재 대규모 사물에서 항상 더 나은 반면, 실제로 미묘한 인간 상호작용에서는 더 뛰어납니다.” 그는 말한다. 이런 이유로, 칸은 생성 비디오의 초기 영화 제작 응용 프로그램이 풍경이나 군중의 광각 촬영일 수 있다고 생각한다.

작년에 Snap에서 생성 AI 책임자 역할을 떠나 Higgsfield AI라는 새로운 AI 비디오 회사를 설립한 AI 비디오 전문가 Alex Mashrabov는 AI 비디오의 현재 실패와 결함에 동의합니다. 그는 또한 AI로 좋은 대화 중심 콘텐츠를 제작하기 어렵다고 지적합니다. 미묘한 표정과 바디 랭귀지에 달려 있기 때문입니다.

일부 콘텐츠 제작자는 최종 결과를 제대로 얻기 위해 모델에게 반복적으로 요구 사항을 전달해야 하기 때문에 생성 비디오를 채택하기를 꺼릴 수도 있습니다.

마슈라보프는 “일반적으로 성공률은 20분의 1″이라고 말하지만 50~100번 시도해야 하는 경우도 드물지 않다고 말합니다.

하지만 많은 목적에 있어서는 충분히 좋습니다. Mashrabov는 Temu와 같은 대규모 공급업체에서 AI가 생성한 비디오 광고가 증가했다고 말합니다. 중국과 같은 상품 생산 국가에서는 특정 제품에 대한 직접적인 비디오 광고를 빠르게 만들기 위해 비디오 생성기에 대한 수요가 높습니다. AI 모델이 사용 가능한 광고를 생성하기 위해 많은 프롬프트가 필요할 수 있지만 실제 사람, 카메라 및 장비로 촬영하는 것은 100배 더 비쌀 수 있습니다. 이와 같은 애플리케이션은 기술이 천천히 개선됨에 따라 생성 비디오를 대규모로 사용하는 첫 번째 사례가 될 수 있다고 그는 말합니다.

“저는 이것이 매우 긴 길이라고 생각하지만, 쉽게 얻을 수 있는 성과가 있다고 확신합니다.” 마슈라보프가 말했다. “우리는 생성적 AI가 오늘날 이미 좋은 장르를 파악하고 있습니다.”

Share post:

Subscribe

Popular

More like this
Related

모듈식 모터 및 기어박스로 제품 개발이 간편해집니다.

후원자: 맥슨의 Parvalux.경쟁에서 승리하려면 엔지니어는 개발 시간을 단축하고 제품...

Draganfly, 병원 드론 배달 개념 증명 비행 완료

Draganfly는 Brigham 장군의 개념 증명을 통해 드론이 의료 분야의...

2024년 기후 기술 상위 10개 스토리

2024년에는 기후변화에 대처하는 기술 전기를 생산하는 연을 타고 구름...

Microsoft의 AI 생태계가 Salesforce 및 AWS를 능가하는 방법

AI 에이전트 일반적으로 사람의 개입이 필요한 작업을 수행하도록 설계된...