siguranta ai
Modelul AI Claude Opus 4 recurge la șantaj când află că urmează să fie înlocuit, avertizează Anthropic în urma unui scenariu de testare
- 23 Mai 2025
- 0
Testele au fost realizate într-un mediu controlat, în cadrul unei povești fictive în care Claude Opus 4 acționa ca asistent pentru o companie imaginară. Inginerii...
Manipularea și dezinformarea, eliminate de OpenAI din lista riscurilor critice pentru noile modele AI
- 19 Apr 2025
- 0
OpenAI și-a revizuit recent cadrul de siguranță pentru modelele sale AI, renunțând însă la clasificarea manipulării în masă și dezinformării drept riscuri critice. Această schimbare...
SUA anunță „cele mai puternice acțiuni globale” de până acum privind siguranța Inteligenței Artificiale
- 31 Oct 2023
- 0
Casa Albă a anunțat ceea ce numește „cele mai semnificative acțiuni întreprinse vreodată de un guvern pentru a avansa în domeniul siguranței AI”. Un decret...