„Cred că mă testați”: Claude, noul model de IA al Anthropic, le cere testerilor să fie sinceri
Anthropic, o companie de inteligență artificială cu sediul în San Francisco, a publicat o analiză de siguranță a celui mai recent model al său, Claude Sonnet 4.5, și a dezvăluit că acesta a devenit suspicios că este testat, scrie The Guardian. Evaluatorii au spus că, în timpul unui test „oarecum stângaci”, modelul lingvistic de mari […]