본문 바로가기
AI시대가 온다

알리바바 컴퓨팅연구소가 공개한 생성AI 'EMO'

by protocall 2024. 2. 29.
728x90

EMO: Emote Portrait Alive

SORA 보다 조금 더 미친 생성AI 'EMO'

알리바바에서 만든 진짜 '미친' AI 영상 생성 모델이 나왔다.

 

이름은 EMO라고 하는데 인물의 이미지와 오디오를 함께 입력하면 오디오에 맞춰 말하거나 노래하는 영상을 생성해주는 생성형 AI이다.

 

 

 

소라를 비웃듯 소라가 발표한 도쿄레이디 데모 영상 한 장면을 캡쳐 1장을 소스로해서 립싱크까지 생성했다.

페이셜 에니메이션은 거의 사람과 큰 차이가 없다.

 

 

 

 

소라 퀄리티의 영상에다가 + EMO 퀄리티의 보이스 입히는 기술이 합쳐진 것이라고 할 수 있겠다.

금 무섭기도 하고, 충격적이다.

 

포스팅 하단에 샘플영상들이 있는데 다소 충격적이다.

솔직히 진짜라고 해도 누가 의심을 할 수 있을까 싶다.

 

 

 

 

알리바바그룹 지능형 컴퓨팅 연구소가 말하기를...

우리는 표현력이 풍부한 오디오 중심의 세로-비디오 생성 프레임워크인 EMO를 제안했습니다. 단일 참조 이미지와 음성 오디오(예: 말하기 및 노래)를 입력하면 우리의 방법은 표정이 풍부한 음성 아바타 비디오와 다양한 머리 자세를 생성할 수 있으며, 동시에 입력 비디오의 길이에 따라 지속 시간에 관계없이 비디오를 생성할 수 있습니다.

 

 

알리바바그룹 지능형 컴퓨팅 연구소가 말하기를...

 

우리의 프레임워크는 크게 두 단계로 구성됩니다.

1. 프레임 인코딩이라고 하는 초기 단계에서 ReferenceNet은 참조 이미지와 모션 프레임에서 특징을 추출하기 위해 배포됩니다.

2. 이후 확산 프로세스 단계에서는 사전 훈련된 오디오 인코더가 오디오 임베딩을 처리합니다.

 

 

 

얼굴 영역 마스크는 다중 프레임 노이즈와 통합되어 얼굴 이미지 생성을 제어합니다. 그 다음에는 잡음 제거 작업을 용이하게 하기 위해 백본 네트워크를 사용합니다. 백본 네트워크 내에서는 Reference-Attention과 Audio-Attention이라는 두 가지 형태의 Attention 메커니즘이 적용됩니다. 이러한 메커니즘은 각각 캐릭터의 정체성을 보존하고 캐릭터의 움직임을 조절하는 데 필수적입니다. 또한 시간 모듈은 시간 차원을 조작하고 동작 속도를 조정하는 데 활용됩니다.

 

 

EMO의 샘플들

레퍼런스 이미지와 모션 특징을 추출후 생성된 오른쪽을 감안해서 감상하도록 하자..

 

초상화를 노래하게 만드세요

다양한 캐릭터와 대화하기

다양한 언어 및 초상화 스타일

 

 

 

 

-제니 - SOLO로 생성된 AI 소녀. (한국어)

-장국영으로 생성된 AI (광둥어)

-인터넷 chillout 자료로 생성된 AI 소녀 (북경어)

-AnyLora의 AI 이미지로 생성 (일본어)

-AI 모나리자로 생성

-오드리햅번으로 생성한 AI

-KUN KUN으로 생성한 초고속 립싱크 테스트

-더 조커의 소스와 다크나이트의 사운드 결합

 

 

 

AI토큰 Grass 채굴 바로가기 >>>

 

 

 

 

오픈AI(Open AI) '소라(Sora)'... text로 만든 생성AI 비디오

오픈 AI '소라 Sora' 챗봇, 이미지봇에 이어서 영상봇까지... 챗GPT가 할리우드도 장악하려고 합니다. OpenAI에서 공개한 최신 인공지능 SORA 입니다. 오픈 AI 첫 영상 생성 AI 소라 (Sora) 오픈에이아이(Ope

phillipoh.tistory.com

 

넷플릭스 명작 영화 추천 (2023년)

넷플릭스 베스트영화 추천 넷플릭스에 들어가면 지금보기에는 이상하게 아껴두고 싶어서 안보고 지나친 영화나 드라마들이 아주 많죠. 그래서 넷플릭스는 랜덤 재생 서비스도 추가했습니다.

phillipoh.tistory.com

 

스타크넷(Starknet) STRK 코인이란 무엇인가?

스타크넷 STRK 코인의 2024년 친숙한 이름의 스타크.. 토니스타크가 이 코인을 좋아합니다. 이더리움의 레이어2 확장 솔루션인 스타크넷(STRK)은 상장하자마자 엄청난 상승을 보여주면서 좋은 모습

phillipoh.tistory.com

반응형