Výzkumníci z Univerzity Carnegieho–Mellonových v americkém Pittsburghu zkusili v rámci odvážného experimentu nahradit pracovníky firmy autonomními AI agenty. Pokus však skončil fiaskem. Nejmodernější modely umělé inteligence nedokázaly plnit zadané úkoly stejně efektivně jako lidé a studie tak potvrdila, že současná AI ještě zdaleka není připravena plně převzít lidskou práci do vlastních rukou.
Vědci vytvořili virtuální firmu se všemi náležitostmi: interními weby, chatovací platformou ve stylu Slacku i digitálními „kolegy“ v rolích personalisty a technického ředitele, na které se ostatní agenti mohli obracet s prosbami o pomoc.
Do tohoto simulovaného podniku nasadili několik špičkových modelů AI a zadali jim úkoly z oborů financí, administrativy a softwarového vývoje, jež by běžně řešili zaměstnanci.
Spektrum úloh sahalo od analýzy databází kavárenského řetězce přes shromažďování zpětné vazby o výkonnosti inženýra a sepsání hodnotící zprávy až po zhlédnutí videoprohlídek kanceláří a výběr nejlepšího prostoru z hlediska vybavení pro zdraví zaměstnanců.
Výsledky byly tristní. Nejvýkonnější model (Claude od společnosti Anthropic) dokázal úspěšně dokončit jen necelou čtvrtinu zadaných úkolů. Všechny ostatní, včetně nového Gemini od Googlu či technologie společnosti OpenAI pohánějící ChatGPT, zvládly jen kolem desetiny úloh.
„V žádné kategorii zadání se AI agentům nepodařilo splnit většinu úkolů,“ uvedl Graham Neubig, profesor z Univerzity Carnegieho–Mellonových a spoluautor studie. Jinými slovy, ani v jednom typu práce agenti nepřekonali lidské úsilí, což výrazně zpochybňuje vize brzkého nástupu plně automatizovaných kanceláří.
Proč robotí zaměstnanci selhali?
Podle autorů studie se především ukázalo, že technologie postrádají „selský rozum“ a tápou v situacích, které by člověk snadno vyřešil. Například jeden AI agent zíral na jednoduché vyskakovací okno a nedokázal kliknout na křížek pro jeho zavření. Když si potom vyžádal pomoc u HR botu, dostal jen plané sliby místo řešení a úkol zůstal nedokončený.
Jindy zmatený AI „zaměstnanec“ nemohl v podnikovém chatu najít správnou osobu, a tak místo ní vytvořil uživatele se stejným jménem.
Další virtuální pracovníci nepochopili formát zadání – například nedokázali vložit odpovědi do připraveného dokumentu – nebo nerozumněli konverzaci s „kolegy“ a předčasně označili úkol za splněný. Tyto chyby vedly k častému nedokončení či chybnému provedení úloh. V simulované firmě tak panoval chaos a termíny se neplnily.
Přesto mnozí lídři firem po takových agentních systémech pokukují. Nedávný průzkum poradenské společnosti Deloitte mezi dvěma a půl tisíci manažerů ukázal, že více než čtvrtina podniků zkoumá využití autonomních agentů ve velkém.
Hlasitě o nich mluví i šéfové technologických gigantů – například CEO Salesforce Marc Benioff prohlásil, že dnešní ředitelé „vedou poslední čistě lidské pracovní síly“, a Jensen Huang z Nvidie odhaduje, že „brzy bude každé IT oddělení spravovat flotilu AI agentů“.

Realita je však střízlivější: současné systémy umělé inteligence si zatím nevědí rady s komplexním slepencem podnikových aplikací a chybějí jim sociální dovednosti, které jsou klíčové například v HR nebo v žurnalistice.
Ani firmy, jež nyní s AI agenty slaví dílčí úspěchy, se zatím neodvážily odstavit lidi na vedlejší kolej. Například 116letá finanční společnost Moody’s experimentuje s trénováním AI agentů na svých rozsáhlých interních datech, od nichž si slibuje urychlení analýzy finančních výkazů.
Americká farmaceutická firma Johnson & Johnson hlásí, že díky interním AI asistentům dokázala zkrátit dobu některých chemických procesů při vývoji léků o polovinu.
Tyto projekty ukazují, že firmy zatím využívají AI spíše jako podporu pro lidské experty než jako jejich náhradu. Navzdory rychlému pokroku tak systémy umělé inteligence stále selhávají v komplexních úlohách a trh prozatím nesměřuje k masivnímu nahrazování zaměstnanců z masa a kostí technologiemi.
The post 1:0 pro lidstvo. AI živé zaměstnance prozatím nenahradí, zjistili vědci appeared first on Forbes.