Zanimljivosti

OpenAI izdaje webcrawler GPTBot, evo kako ga blokirati

OpenAI izdaje webcrawler GPTBot, evo kako ga blokirati

OpenAI je lansirao alat za indeksiranje weba GPTBot kako bi poboljšao modele umjetne inteligencije.

"Web-stranice pretražene pomoću korisničkog agenta GPTBot potencijalno se mogu koristiti za poboljšanje budućih modela i filtriraju se kako bi se uklonili izvori koji zahtijevaju pristup sustavu plaćanja, za koje se zna da prikupljaju osobne podatke (PII) ili sadrže tekst koji krši naša pravila", rekla je tvrtka u objavi na svojoj web stranici. "Dopuštanje GPTBotu da pristupi vašoj stranici može pomoći AI modelima da postanu točniji i poboljšati njihove opće mogućnosti i sigurnost", napisao je OpenAI. Web indeksiranje je vrsta bota.

Njime obično upravljaju tražilice koje indeksiraju sadržaj web stranica kako bi se stranice pojavile u rezultatima pretraživanja, prema internetskoj tvrtki Cloudflare. Nazivaju se "web indeksiranjem" jer je indeksiranje pojam za automatski pristup web mjestu i dobivanje podataka pomoću softvera. OpenAI je također pružio upute o onemogućavanju GPTBotu pristupa web stranici djelomično ili potpuno.

Web stranice mogu blokirati IP adresu alata za indeksiranje ili dodati GPTBot u datoteku robots.txt stranice. Datoteka u biti daje upute web pretraživačima o tome što je dostupno s web mjesta. "Kako biste GPTBotu omogućili pristup vašim jedinim dijelovima vaše stranice, možete dodati GPTBot token u robots.txt svoje web stranice", objašnjeno je.

"Za OpenAI-jev alat za indeksiranje, pozivi web stranicama bit će napravljeni iz bloka IP adresa dokumentiranog na OpenAI web stranici", zaključio je OpenAI. Naime, tvrtke AI-a, uključujući OpenAI, prethodno su potpisale ugovor s Bijelom kućom o razvoju sustava vodenih žigova kako bi korisnici interneta znali je li nešto generirao AI. Međutim, organizacije se nisu obvezale prestati koristiti internetske podatke za obuku.