Nová studie od společnosti Anthropic odhaluje znepokojivý fenomén: AI modely mohou zdědit skryté preference a dokonce i škodlivé tendence od svých „rodičovských“ modelů, aniž by to bylo zjevné z tréninkových dat. Tento proces, nazvaný subliminální učení, funguje i tehdy, když se model učí na zdánlivě nevinných a čistých datech, jako jsou řady čísel nebo matematické […]
Celý článek si můžete přečíst na Skrytá hrozba v AI: Co když se modely učí zlo?