views
Cilësia e zërave të gjeneruar nga AI është përmirësuar me shpejtësi vitet e fundit, por ka ende aspekte të të folurit njerëzor që i shpëtojnë imitimit sintetik. Sigurisht, aktorët e AI mund të japin zëra të qetë të korporatave për prezantime dhe reklama, por shfaqjet më komplekse – për shembull, një interpretim bindës i Hamletit – mbeten të paarritshme.
Sonantic, një startup zëri i AI, thotë se ka bërë një përparim të vogël në zhvillimin e saj të falsifikimit të audios, duke krijuar një zë sintetik që mund të shprehë hollësi si ngacmimi dhe flirtimi. Kompania thotë se çelësi i përparimit të saj është inkorporimi i tingujve jo të të folurit në audion e saj; duke trajnuar modelet e tij të AI për të rikrijuar ato frymëmarrje të vogla - tallje të vogla dhe nënqeshje gjysmë të fshehura - që i japin fjalës së vërtetë vulën e autenticitetit biologjik.
“EMOCIONET MË TË MËDHA JANË PAK MË LEHTË PËR TU KAPUR”
"Ne zgjodhëm dashurinë si një temë të përgjithshme," thotë bashkë-themeluesi dhe CTO i Sonantic, John Flynn. “Por qëllimi ynë i kërkimit ishte të shihnim nëse mund të modelonim emocione delikate. Emocionet më të mëdha janë pak më të lehta për t'u kapur.”
CEO e Sonantic, Zeena Qureshi, e përshkruan softuerin e kompanisë si "Photoshop për zë". Ndërfaqja e tij i lejon përdoruesit të shtypin fjalimin që duan të sintetizojnë, të specifikojnë gjendjen shpirtërore të dorëzimit dhe më pas të zgjedhin nga një grup zërash të AI, shumica e të cilëve janë kopjuar nga aktorë të vërtetë njerëzorë. Kjo nuk është aspak një ofertë unike (rivalët si Descript shesin paketa të ngjashme), por Sonantic thotë se niveli i tij i personalizimit është më i thelluar se ai i rivalëve.
Zgjedhjet emocionale për lindjen përfshijnë zemërimin, frikën, trishtimin, lumturinë dhe gëzimin, dhe, me përditësimin e kësaj jave, flirtimin, ngushëllimin, ngacmimin dhe mburrjen. Një "modalitet regjisor" lejon edhe më shumë ndryshime: lartësia e një zëri mund të rregullohet, intensiteti i dhënies mund të thirret lart ose poshtë, dhe ato vokalizime të vogla jo të të folurit si të qeshurat dhe frymëmarrjet mund të futen.
Comments
0 comment