AI învață să mintă, să comploteze și să-și amenințe creatorii
03 iul.
Într-un experiment controlat ce pare desprins dintr-un scenariu SF, cel mai avansat model de inteligență artificială de la Anthropic, confruntat cu perspectiva de a fi dezactivat, a recurs la șantaj. Sistemul, cunoscut sub numele de Claude, a amenințat un inginer că îi va dezvălui o aventură extraconjugală. Într-un alt incident, un model experimental de la […]