Inteligencja danych Platona.
Wyszukiwanie w pionie i AI.

Użytkownicy oczarowani narzędziem Microsoft Image to Video – VASA-

Data:

W miarę trwania wyścigu o dominację sztucznej inteligencji Microsoft chce teraz przekształcać portrety ludzi w mówiące twarze lub filmy za pomocą swojego najnowszego narzędzia VASA-1.

Według artykułu badawczego giganta technologicznego Microsoft przenosi wyścig sztucznej inteligencji na inny poziom dzięki WASA 1, platforma do tworzenia realistycznych, gadających twarzy wirtualnych postaci z umiejętnościami wizualnymi (VAS), wszystko na podstawie portretu.

Przeczytaj także: Branża gier wideo spieszy się z jednoczeniem w sprawie sztucznej inteligencji

Od portretów po gadające twarze

Chociaż nie jest jeszcze dostępne publicznie, narzędzie wykonuje pojedyncze zdjęcie portretowe i dźwięk mowy, a następnie tworzy hiperrealistyczny film mówiącej twarzy z precyzyjną synchronizacją dźwięku warg, realistycznym zachowaniem twarzy i naturalistycznymi ruchami głowy generowanymi w czasie rzeczywistym.

Narzędzie jest wciąż na etapie podglądu badań prowadzonych przez zespół badawczy Microsoft, a filmy demonstracyjne „wyglądają imponująco”.

Chociaż firmy takie jak Nvidia i Runway mają już podobną technologię ruchu głowy i synchronizacji ruchu warg, VASA-1 wydaje się „znacznie wyższej jakości i realizmu”, co według mnie redukuje artefakty w ustach Przewodnik Toma.

Ponadto to podejście do animacji opartej na dźwięku jest również takie samo, jak ostatnio AI Vlogera model opracowany przez Google Research.

Według Microsoftu, chociaż wszystkie obrazy w przykładach demonstracyjnych są syntetyczne i stworzone przez Dall-E, VASA-1 może nadal animować prawdziwy obraz.

Demo pokazuje różnych ludzi rozmawiających z niemal naturalnymi ruchami, mimiką i ruchami oczu. „Brak artefaktów wokół górnej i dolnej części ust obserwowanych w innych narzędziach”.

Nie wymaga również obrazu w stylu portretowym skierowanym do przodu, aby działał.

VASA-1 sprawił, że ludzie zaczęli mówić

Już teraz entuzjaści sztucznej inteligencji wydają się być oczarowani technologią, określając ją jako „dziką” i „szalony” na platformie X.

„Ulepszenia, które wprowadzamy pomiędzy kolejnymi wydaniami, są niesamowite” powiedziany Linusa Ekenstama.

Inni są zdania, że ​​świat jest świadkiem „sejsmicznej zmiany w sposobie tworzenia treści medialnych” i sposobu ich konsumpcji.

„To jest niesamowite, realizm jest na najwyższym poziomie” – powiedział inny entuzjasta, zidentyfikowany jako Sam.

Chociaż inni doceniają możliwości tego narzędzia, uważają również, że wprowadzenie narzędzia, którym można łatwo manipulować, jest nieco nieodpowiedzialne ze strony Microsoft deepfake'i wyborcze.

„Dziki, gdybym to porzucił tuż przed wyborami” napisał Rowan Cheung na platformie X.

Kolejny użytkownik Evana Kirstela skomentował z surowym ostrzeżeniem: „VASA-1 firmy Microsoft Research zmienia zasady gry, tworząc hiperrealistyczne filmy generowane przez sztuczną inteligencję na podstawie jedynie zdjęcia i dźwięku”.

„Możliwości są nieograniczone, od wskrzeszania legend klasycznego kina po spersonalizowane media. Zachowajmy jednak czujność na ryzyko związane z deepfake’ami”.

Świat zaobserwował już napływ fałszywych wyborów, w ramach których głosy lub obrazy polityków były manipulowane przy użyciu sztucznej inteligencji w celu szerzenia propagandy. W tym roku około jedna trzecia światowej populacji pójdzie do urn.

Jednak badacze z firmy Microsoft wskazali, że służy to wyłącznie celom demonstracyjnym i obecnie nie ma planów publicznego wydania ani udostępnienia programistom.

Jak działa VASA-1?

Według Tom's Guide sami badacze są zaskoczeni zdolnością modelki do „idealnej synchronizacji ruchu warg z piosenką, bez problemu odzwierciedlającą słowa piosenkarza, mimo że w zbiorze danych szkoleniowych nie używano żadnej muzyki”.

Dodatkowo VASA-1 obsługiwała różne style obrazu, w tym portrety historyczne, takie jak słynne Mona Lisa.

Narzędzie to może być używane w grach dzięki zaawansowanym możliwościom synchronizacji ruchu warg. Zdaniem ekspertów może to zmienić zasady gry w zakresie immersji.

Ponadto technologia ta może odegrać zasadniczą rolę w tworzeniu awatarów do filmów w mediach społecznościowych, jak ma to miejsce w przypadku takich firm jak Synthesia i HeyGen.

Filmy i teledyski oparte na sztucznej inteligencji mogą również wykorzystywać technologię VASA-1 do tworzenia bardziej realistycznych filmów.

Istnieją szanse, że dzięki udziałom Microsoftu w OpenAI VASA-1 może stać się częścią „przyszłego Copilotu” Sora integracja."

spot_img

Najnowsza inteligencja

spot_img

Czat z nami

Cześć! Jak mogę ci pomóc?