siguranta ai

Anthropic introduce o funcție prin care modelele Claude pot opri conversațiile considerate abuzive

Anthropic introduce o funcție prin care modelele Claude pot opri conversațiile considerate abuzive

17 aug.
Anthropic introduce o nouă funcționalitate în modelele Claude, care le permite să încheie conversații considerate „dăunătoare sau abuzive”. Compania precizează că această măsură se aplică doar „în cazuri rare și extreme de interacțiuni persistente” și are ca scop protejarea modelului de inteligență artificială, nu a utilizatorului uman, potrivit TechCrunch.
Modelul AI Claude Opus 4 recurge la șantaj când află că urmează să fie înlocuit, avertizează Anthropic în urma unui scenariu de testare
Secțiune susținută delogo

Modelul AI Claude Opus 4 recurge la șantaj când află că urmează să fie înlocuit, avertizează Anthropic în urma unui scenariu de testare

23 mai
Manipularea și dezinformarea, eliminate de OpenAI din lista riscurilor critice pentru noile modele AI
Secțiune susținută delogo

Manipularea și dezinformarea, eliminate de OpenAI din lista riscurilor critice pentru noile modele AI

19 apr.
OpenAI și-a revizuit recent cadrul de siguranță pentru modelele sale AI, renunțând însă la clasificarea manipulării în masă și dezinformării drept riscuri critice. Această schimbare de abordare a generat reacții diverse în comunitatea de experți în siguranța inteligenței artificiale. În loc să evalueze modelele AI înainte de lansare din perspectiva potențialului lor de a influența […]
SUA anunță „cele mai puternice acțiuni globale” de până acum privind siguranța Inteligenței Artificiale

SUA anunță „cele mai puternice acțiuni globale” de până acum privind siguranța Inteligenței Artificiale

31 oct.
Casa Albă a anunțat ceea ce numește „cele mai semnificative acțiuni întreprinse vreodată de un guvern pentru a avansa în domeniul siguranței AI”. Un decret al președintelui Joe Biden impune dezvoltatorilor de inteligență artificială (AI) să împărtășească rezultatele privind siguranța cu guvernul SUA. Măsura plasează SUA în centrul dezbaterii globale privind guvernanța IA, scrie BBC. […]