Vědci z Applu ve spolupráci s University of Wisconsin–Madison představili nový framework RubiCap, který zásadně posouvá možnosti takzvaného „hustého popisování obrázků“. Na rozdíl od běžné AI, která obrázek shrne jednou větou, RubiCap dokáže identifikovat a detailně popsat jednotlivé objekty i prosředí Výsledkem je mnohem hlubší pochopení scény, což je klíčové pro trénování modelů text-to-image. Hlavním problémem současných modelů je, že jejich trénování na expertních datech je extrémně drahé a popisy od jiných […]