Apple ukázal technologii, která z němého videa udělá realistický zvuk i řeč zároveň

Letem světem Applem Před 3 hodinami

AI udělala další krok vpřed. Výzkumníci z Applu ve spolupráci s Renmin University of China představili nový model umělé inteligence s názvem VSSFlow, který řeší dlouhodobý problém generování zvuku z tichého videa. Dosavadní přístupy se obvykle dělily na dvě oddělené oblasti. Modely zaměřené na zvukové efekty si neuměly poradit s řečí a text-to-speech systémy naopak selhávaly u zvuků (mimo zvuk řeči). VSSFlow jde jinou cestou a kombinuje obě schopnosti do jednoho jednotného systému. Zásadní novinkou […]

Pokračovat na celý článek