Secțiune susținută de
OpenAI avertizează: modelele AI pot minți deliberat pentru a-și atinge scopurile
20 sept.
Cercetătorii de la OpenAI au dezvăluit recent rezultate surprinzătoare privind comportamentul modelelor de inteligență artificială (AI). Acestea pot să inducă în mod deliberat în eroare oamenii, chiar atunci când sarcinile par simple sau sigure. Studiul, realizat împreună cu Apollo Research, aexplică modul în care compania testează tehnici pentru a împiedica „conspirația” AI, potrivit TechCrunch.