G4Media.ro

Compania care a creat ChatGPT lansează un program care ”mătură” internetul pentru…

Sursa foto: Unsplash / Levart Photographer

Compania care a creat ChatGPT lansează un program care ”mătură” internetul pentru a antrena și îmbunătăți capacitățile Inteligenței Artificiale

OpenAI, Compania care a creat ChatGPT, a lansat un web crawler (un soft care ”mătură” site-urile publice) pentru a îmbunătăți modelele de inteligență artificială precum GPT-4, transmite Mashable.

Odată cu lansarea webcrawlerul-ul GPTBot, OpenAI a publicat și instrucțiuni despre cum administratorii de site-uri îl pot bloca.

Denumit GPTBot, sistemul analizează internetul pentru a antrena și îmbunătăți capacitățile AI. Utilizarea GPTBot are potențialul de a îmbunătăți modelele de inteligență artificială existente în ceea ce privește aspecte precum acuratețea și siguranța, potrivit unei postări pe blog a OpenAI.

„Paginile web analizate cu agentul utilizator GPTBot pot fi potențial folosite pentru a îmbunătăți modelele viitoare și sunt filtrate pentru a elimina sursele care necesită acces la paywall, despre care se știe că adună informații de identificare personală sau care au text care încalcă politicile noastre”, se arată în postare.

Cu toate acestea, site-urile web pot alege să restricționeze accesul la web crawler și să împiedice GPTBot să le acceseze site-urile, fie parțial, fie prin excluderea totală. OpenAI a precizat că operatorii de site-uri web pot refuza crawlerul prin blocarea adresei IP a acestuia sau în fișierul Robots.txt al unui site.

Anterior, OpenAI a fost criticată pentru modul în care colectează date și pentru lucruri precum încălcarea drepturilor de autor și încălcarea confidențialității. În luna iunie a anului trecut, platforma AI a fost dată în judecată pentru că ar fi furat date personale pentru a antrena ChatGPT.

Funcțiile sale de excludere au fost implementate abia recent, caracteristici precum dezactivarea istoricului de chat permițând utilizatorilor un control mai mare asupra datelor personale care pot fi accesate.

ChatGPT 3.5 și 4 au fost antrenate pe date online și texte care datează până în septembrie 2021. În prezent, nu există nicio modalitate de a elimina conținutul din acest set de date.

Potrivit OpenAI, puteți interzice GPTBot adăugându-l la Robots.txt al site-ului dvs., care este, în esență, un fișier text care instruiește crawlerele web cu privire la ceea ce pot sau nu pot accesa de pe un site web.

De asemenea, puteți personaliza părțile pe care le poate folosi un web crawler, permițând anumite pagini și nepermițând altele.

Urmărește mai jos producțiile video ale G4Media:

Susține-ne activitatea G4Media logo
Donație Paypal recurentă

Donează lunar pentru susținerea proiectului G4Media

Donează prin Transfer Bancar

CONT LEI: RO89RZBR0000060019874867

Deschis la Raiffeisen Bank
Donează prin Patreon

Donează

Citește și...

1 comentariu

  1. Pai daca site-urile pot alege sa refuze crawlerul și chiar o fac iar cele conspiraționiste nu îl vor refuza, ghici care va fi rezultatul? Un ChatGPT care crede că conspirațiile sunt adevărul. Un ChatGPT Inutil