Użytkownicy oczarowani narzędziem firmy Microsoft do przetwarzania obrazu na wideo

W miarę trwania wyścigu o dominację sztucznej inteligencji Microsoft chce teraz przekształcać portrety ludzi w mówiące twarze lub filmy za pomocą swojego najnowszego narzędzia VASA-1.

Według artykułu badawczego giganta technologicznego Microsoft przenosi wyścig sztucznej inteligencji na inny poziom dzięki WASA 1, platforma do tworzenia realistycznych, gadających twarzy wirtualnych postaci z umiejętnościami wizualnymi (VAS), wszystko na podstawie portretu.

Przeczytaj także: Branża gier wideo spieszy się z jednoczeniem w sprawie sztucznej inteligencji

Od portretów po gadające twarze

Chociaż nie jest jeszcze dostępne publicznie, narzędzie wykonuje pojedyncze zdjęcie portretowe i dźwięk mowy, a następnie tworzy hiperrealistyczny film mówiącej twarzy z precyzyjną synchronizacją dźwięku warg, realistycznym zachowaniem twarzy i naturalistycznymi ruchami głowy generowanymi w czasie rzeczywistym.

Narzędzie jest wciąż na etapie podglądu badań prowadzonych przez zespół badawczy Microsoft, a filmy demonstracyjne „wyglądają imponująco”.

Chociaż firmy takie jak Nvidia i Runway mają już podobną technologię ruchu głowy i synchronizacji ruchu warg, VASA-1 wydaje się „znacznie wyższej jakości i realizmu”, co według mnie redukuje artefakty w ustach Przewodnik Toma.

Ponadto to podejście do animacji opartej na dźwięku jest również takie samo, jak ostatnio AI Vlogera model opracowany przez Google Research.

Według Microsoftu, chociaż wszystkie obrazy w przykładach demonstracyjnych są syntetyczne i stworzone przez Dall-E, VASA-1 może nadal animować prawdziwy obraz.

Demo pokazuje różnych ludzi rozmawiających z niemal naturalnymi ruchami, mimiką i ruchami oczu. „Brak artefaktów wokół górnej i dolnej części ust obserwowanych w innych narzędziach”.

Nie wymaga również obrazu w stylu portretowym skierowanym do przodu, aby działał.

Microsoft właśnie wprowadził VASA-1.

To nowy model sztucznej inteligencji, który może zamienić 1 zdjęcie i 1 fragment audio w w pełni realistyczny ludzki deepfake.

Aż szkoda rzucić to tuż przed wyborami 😬pic.twitter.com/MuLkZVOKRM

— Rowan Cheung (@rowancheung) 18 kwietnia 2024 r.

VASA-1 sprawił, że ludzie zaczęli mówić

Już teraz entuzjaści sztucznej inteligencji wydają się być oczarowani technologią, określając ją jako „dziką” i „szalony” na platformie X.

„Ulepszenia, które wprowadzamy pomiędzy kolejnymi wydaniami, są niesamowite” powiedziany Linusa Ekenstama.

Inni są zdania, że świat jest świadkiem „sejsmicznej zmiany w sposobie tworzenia treści medialnych” i sposobu ich konsumpcji.

„To jest niesamowite, realizm jest na najwyższym poziomie” – powiedział inny entuzjasta, zidentyfikowany jako Sam.

Chociaż inni doceniają możliwości tego narzędzia, uważają również, że wprowadzenie narzędzia, którym można łatwo manipulować, jest nieco nieodpowiedzialne ze strony Microsoft deepfake'i wyborcze.

„Dziki, gdybym to porzucił tuż przed wyborami” napisał Rowan Cheung na platformie X.

Kolejny użytkownik Evana Kirstela skomentował z surowym ostrzeżeniem: „VASA-1 firmy Microsoft Research zmienia zasady gry, tworząc hiperrealistyczne filmy generowane przez sztuczną inteligencję na podstawie jedynie zdjęcia i dźwięku”.

„Możliwości są nieograniczone, od wskrzeszania legend klasycznego kina po spersonalizowane media. Zachowajmy jednak czujność na ryzyko związane z deepfake’ami”.

Świat zaobserwował już napływ fałszywych wyborów, w ramach których głosy lub obrazy polityków były manipulowane przy użyciu sztucznej inteligencji w celu szerzenia propagandy. W tym roku około jedna trzecia światowej populacji pójdzie do urn.

Jednak badacze z firmy Microsoft wskazali, że służy to wyłącznie celom demonstracyjnym i obecnie nie ma planów publicznego wydania ani udostępnienia programistom.

Jak działa VASA-1?

Według Tom's Guide sami badacze są zaskoczeni zdolnością modelki do „idealnej synchronizacji ruchu warg z piosenką, bez problemu odzwierciedlającą słowa piosenkarza, mimo że w zbiorze danych szkoleniowych nie używano żadnej muzyki”.

Dodatkowo VASA-1 obsługiwała różne style obrazu, w tym portrety historyczne, takie jak słynne Mona Lisa.

Narzędzie to może być używane w grach dzięki zaawansowanym możliwościom synchronizacji ruchu warg. Zdaniem ekspertów może to zmienić zasady gry w zakresie immersji.

Ponadto technologia ta może odegrać zasadniczą rolę w tworzeniu awatarów do filmów w mediach społecznościowych, jak ma to miejsce w przypadku takich firm jak Synthesia i HeyGen.

Filmy i teledyski oparte na sztucznej inteligencji mogą również wykorzystywać technologię VASA-1 do tworzenia bardziej realistycznych filmów.

Istnieją szanse, że dzięki udziałom Microsoftu w OpenAI VASA-1 może stać się częścią „przyszłego Copilotu” Sora integracja."

Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
Źródło: https://metanews.com/enthusiasts-smitten-by-image-to-video-tool-vasa-1/

Inteligencja danych Platona.
Wyszukiwanie w pionie i AI.

Użytkownicy oczarowani narzędziem Microsoft Image to Video – VASA-

Od portretów po gadające twarze

VASA-1 sprawił, że ludzie zaczęli mówić

Jak działa VASA-1?

Magic Force Game 7 w Cleveland

Następca głównego trenera Lakers pozostaje nieznany

Najnowsza inteligencja

Niesamowite historie technologiczne z całego internetu z tego tygodnia (do 4 maja)

Bitcoin wyskakuje powyżej 64,000 78 dolarów po tym, jak GBTC firmy Grayscale przełamuje 63-dniową passę wypływów z XNUMX milionami dolarów nowych pieniędzy

Magikarp, Shinx, Rellor i Varoom Mass Outbreak – Pokémon SV

WienerAI osiąga kamień milowy, gdy posiadacze spieszą się, aby postawić swoje WAI

Holenderskie władze przejęły 12 milionów euro w wyniku dochodzenia w sprawie oszustwa na platformie hazardowej

Przedsprzedaż WienerAI osiągnęła 750 tys. dolarów wraz ze wzrostem zainteresowania nowym botem handlowym

Czat z nami

Inteligencja danych Platona.Wyszukiwanie w pionie i AI.

Użytkownicy oczarowani narzędziem Microsoft Image to Video – VASA-

Od portretów po gadające twarze

VASA-1 sprawił, że ludzie zaczęli mówić

Jak działa VASA-1?

Najnowsza inteligencja

Czat z nami

Inteligencja danych Platona.
Wyszukiwanie w pionie i AI.