siguranta ai - | G4Media.ro

Anthropic introduce o funcție prin care modelele Claude pot opri conversațiile considerate abuzive

17 aug.

Anthropic introduce o nouă funcționalitate în modelele Claude, care le permite să încheie conversații considerate „dăunătoare sau abuzive”. Compania precizează că această măsură se aplică doar „în cazuri rare și extreme de interacțiuni persistente” și are ca scop protejarea modelului de inteligență artificială, nu a utilizatorului uman, potrivit TechCrunch.

Modelul AI Claude Opus 4 recurge la șantaj când află că urmează să fie înlocuit, avertizează Anthropic în urma unui scenariu de testare

Secțiune susținută de

Modelul AI Claude Opus 4 recurge la șantaj când află că urmează să fie înlocuit, avertizează Anthropic în urma unui scenariu de testare

TechRider.ro•

23 mai

Manipularea și dezinformarea, eliminate de OpenAI din lista riscurilor critice pentru noile modele AI

Secțiune susținută de

Manipularea și dezinformarea, eliminate de OpenAI din lista riscurilor critice pentru noile modele AI

TechRider.ro•

19 apr.

OpenAI și-a revizuit recent cadrul de siguranță pentru modelele sale AI, renunțând însă la clasificarea manipulării în masă și dezinformării drept riscuri critice. Această schimbare de abordare a generat reacții diverse în comunitatea de experți în siguranța inteligenței artificiale. În loc să evalueze modelele AI înainte de lansare din perspectiva potențialului lor de a influența […]

SUA anunță „cele mai puternice acțiuni globale” de până acum privind siguranța Inteligenței Artificiale

Redacția•

31 oct.

Casa Albă a anunțat ceea ce numește „cele mai semnificative acțiuni întreprinse vreodată de un guvern pentru a avansa în domeniul siguranței AI”. Un decret al președintelui Joe Biden impune dezvoltatorilor de inteligență artificială (AI) să împărtășească rezultatele privind siguranța cu guvernul SUA. Măsura plasează SUA în centrul dezbaterii globale privind guvernanța IA, scrie BBC. […]