Ono što ovu tehnologiju izdvaja od drugih AI rešenja jeste njena sposobnost da obrađuje i menja postojeće audio zapise

Nvidia je u ponedeljak predstavila novi model veštačke inteligencije za generisanje muzike i zvuka, koji može da menja glasove i stvara nove zvuke - tehnologiju namenjenu producentima muzike, filmova i video igara.

Nvidia, najveći svetski dobavljač čipova i softvera za stvaranje AI sistema, saopštila je da trenutno nema planove za javno objavljivanje ove tehnologije, koju naziva Fugatto, skraćeno od Foundational Generative Audio Transformer Opus 1.

Ovaj model pridružuje se sličnim tehnologijama koje su razvile startup kompanije poput Runway-a, kao i veći igrači poput Meta Platforms, koji omogućavaju generisanje zvuka ili videa na osnovu tekstualnih opisa.

Verzija Nvidie, sa sedištem u Santa Klari, Kalifornija, omogućava generisanje zvučnih efekata i muzike na osnovu tekstualnog opisa, uključujući i potpuno nove zvuke, poput trube koja zvuči kao lajanje psa.

Ono što ovu tehnologiju izdvaja od drugih AI rešenja jeste njena sposobnost da obrađuje i menja postojeće audio zapise, na primer, pretvaranjem melodije odsvirane na klaviru u liniju koja zvuči kao da je peva ljudski glas, ili preoblikovanjem snimka govora tako da promeni akcenat i emociju izraženu u govoru.

- Ako pogledamo sintetički zvuk u poslednjih 50 godina, muzika danas zvuči drugačije zahvaljujući računarima i sintisajzerima. Verujem da će generativna veštačka inteligencija doneti nove mogućnosti muzici, video igrama i običnim ljudima koji žele da stvaraju - rekao je Brajan Katanzaro, potpredsednik istraživanja primenjenog dubokog učenja u kompaniji Nvidia.

Dok kompanije poput OpenAI pregovaraju sa holivudskim studijima o tome da li i kako AI može da se koristi u industriji zabave, odnosi između tehnoloških kompanija i Holivuda postaju napeti, posebno nakon što je holivudska zvezda Skarlet Johanson optužila OpenAI za imitiranje njenog glasa.

Nvidia je navela da je njen novi model treniran na otvorenim podacima i da još razmatra da li i na koji način će ga javno objaviti.

- Svaka generativna tehnologija nosi određene rizike, jer ljudi mogu koristiti tu tehnologiju za generisanje sadržaja koji ne bismo želeli da stvaraju. Zbog toga nemamo trenutne planove za njeno puštanje u javnost - rekao je Katanzaro.

Kreatori generativnih AI modela i dalje traže načine kako da spreče zloupotrebu tehnologije, poput generisanja dezinformacija ili kršenja autorskih prava stvaranjem sadržaja zaštićenog autorskim pravima.

Ni OpenAI ni Meta još uvek nisu objavili kada planiraju da javno predstave svoje modele za generisanje zvuka ili videa.

Autor: Redportal.rs