Mona Lisa duke repuar? Inteligjenca e re e Microsoft AI animon fytyrat nga fotot

Mona Lisa tani mund të bëjë më shumë sesa të buzëqeshë, falë teknologjisë së re të inteligjencës artificiale nga Microsoft. Javën e kaluar, studiuesit e Microsoft detajuan një model të ri të AI që ata kanë zhvilluar që mund të marrë një imazh të palëvizshëm të një fytyre dhe një videoklip audio të dikujt që flet dhe të krijojë automatikisht një video realiste të atij personi që flet.

Videot të cilat mund të bëhen nga fytyra fotorealiste, si dhe karikaturat ose vepra arti - janë të kompletuara me sinkronizimin e buzëve dhe lëvizjet natyrale të fytyrës dhe kokës.

Në një video demo, studiuesit treguan se si animuan Mona Lizën për të recituar një rep komik nga aktorja Anne Hathaway.

Rezultatet nga modeli i AI, i quajtur VASA-1, janë edhe zbavitëse dhe paksa turbulluese në realitetin e tyre. Microsoft tha se teknologjia mund të përdoret për edukim ose "përmirësimin e aksesit për individët me sfida komunikimi", ose potencialisht për të krijuar shoqërues virtualë për njerëzit. Por është gjithashtu e lehtë të shihet se si mjeti mund të abuzohet dhe përdoret për të imituar njerëz të vërtetë.

Është një shqetësim që shkon përtej Microsoft: ndërsa shfaqen më shumë mjete për të krijuar imazhe, video dhe audio bindëse të krijuara nga AI, ekspertët shqetësohen se keqpërdorimi i tyre mund të çojë në forma të reja dezinformimi. Disa shqetësohen gjithashtu se teknologjia mund të prishë më tej industritë krijuese nga filmi tek reklamat.

Për momentin, Microsoft tha se nuk planifikon të lëshojë menjëherë modelin VASA-1 për publikun. Lëvizja është e ngjashme me mënyrën se si partneri i Microsoft OpenAI po trajton shqetësimet rreth mjetit të tij video të krijuar nga AI, Sora: OpenAI ngacmoi Sora në shkurt, por deri më tani e ka vënë atë në dispozicion vetëm për disa përdorues profesionistë dhe profesorë të sigurisë kibernetike për qëllime testimi.

"Ne jemi kundër çdo sjelljeje për të krijuar përmbajtje mashtruese ose të dëmshme të personave realë," thanë studiuesit e Microsoft në një postim në blog. Por, shtuan ata, kompania nuk ka “nuk ka plane të lëshojë” produktin publikisht “derisa të jemi të sigurt se teknologjia do të përdoret me përgjegjësi dhe në përputhje me rregulloret e duhura”.

Lëvizja e fytyrave

Modeli i ri i inteligjencës artificiale të Microsoft-it është trajnuar në video të shumta të fytyrave të njerëzve ndërsa flasin, dhe është krijuar për të njohur lëvizjet natyrale të fytyrës dhe kokës, duke përfshirë "lëvizjen e buzëve, shprehjen (jo buzëve), shikimin e syve dhe pulsimin, ndër të tjera", thanë studiuesit. Rezultati është një video më e gjallë kur VASA-1 animon një foto të palëvizshme.

Për shembull, në një video demo të vendosur në një klip të dikujt që tingëllon i shqetësuar, me sa duket ndërsa luan videolojëra, fytyra që flet ka vetulla të gërvishtura dhe buzë të shtrënguara.

Mjeti i AI mund të drejtohet gjithashtu për të prodhuar një video ku subjekti shikon në një drejtim të caktuar ose shpreh një emocion specifik.

Kur shikon nga afër, ka ende shenja që videot janë krijuar nga makineri, të tilla si pulsimi i rrallë dhe lëvizjet e ekzagjeruara të vetullave. Por Microsoft tha se beson se modeli i tij “i kalon dukshëm” mjetet e tjera të ngjashme dhe “hap rrugën për angazhime në kohë reale me avatarë të gjallë që imitojnë sjelljet e bisedave njerëzore”.