OpenAI, GPTBot e la strada verso GPT-5: cosa c'è da sapere sul futuro dell'IA

OpenAI, una delle principali aziende nel campo dell'intelligenza artificiale, ha presentato al pubblico "GPTBot", il suo innovativo web crawler. Concepito per indagare ed indicizzare i contenuti del vasto universo del web, questo strumento potrebbe costituire un passo fondamentale nell'evoluzione delle future versioni di ChatGPT.

L'evoluzione del Web Crawling: GPTBot di OpenAI

Il web crawling non è una novità. Molti lo conoscono come "spidering" ed è un processo grazie al quale, motori di ricerca come Google e Bing, possono catalogare e visualizzare i contenuti delle pagine web nei risultati delle ricerche. Tuttavia, quello che distingue GPTBot è il suo potenziale impiego nel potenziamento dei modelli d'intelligenza artificiale. Secondo quanto riferito da OpenAI in un recente post sul suo blog, i dati rilevati dal nuovo strumento potrebbero essere utilizzati per "migliorare la precisione e ampliare le capacità delle future interazioni".

Ma quali contenuti verranno indicizzati da GPTBot? OpenAI ha dichiarato che il suo crawler raccoglierà dati pubblicamente disponibili ed escluderà fonti che richiedono contenuti a pagamento, quelle conosciute per raccogliere informazioni personali o che presentano testi contrari alle sue linee guida. Da segnalare, inoltre, la possibilità per i proprietari di siti web di bloccare l'accesso a GPTBot, semplicemente inserendo un comando "disallow" in un file standard sul loro server.

Verso un futuro GPT-5?

Questo annuncio arriva poco dopo un altro movimento interessante da parte di OpenAI. Solo tre settimane fa, l'azienda ha depositato una domanda di marchio per "GPT-5" presso l'Ufficio Brevetti e Marchi degli Stati Uniti (qui maggiori dettagli). Questo lascia presagire l'arrivo del successore di GPT-4, comprendendo l'uso del termine "GPT-5" anche per software legati alla conversione audio in testo e al riconoscimento vocale. Tuttavia, Sam Altman, fondatore e CEO di OpenAI, ha recentemente sottolineato che siamo ancora lontani dal vedere la prossima generazione di ChatGPT. Secondo lui, prima di avviare la formazione di GPT-5, sono necessarie diverse verifiche di sicurezza.

Preoccupazioni per i dati privati

Non tutto è rose e fiori per OpenAI: recentemente, sono emerse preoccupazioni riguardo alle tattiche di raccolta dati dell'azienda. In particolare, vi sono state critiche riguardanti questioni di copyright e consenso. A giugno, l'ente di vigilanza sulla privacy giapponese ha emesso un avviso per OpenAI accusandola di raccogliere dati sensibili senza permesso. Analogamente, l'Italia ha temporaneamente proibito l'uso di ChatGPT ad aprile, sostenendo che violasse diverse leggi sulla privacy dell'Unione Europea.

L'ombra delle controversie si estende ulteriormente: a fine giugno, un'azione collettiva è stata presentata contro OpenAI da 16 denuncianti, accusando l'azienda di aver accesso a informazioni private attraverso le interazioni degli utenti con ChatGPT. Se tali accuse fossero confermate, OpenAI e Microsoft, citata come convenuta, violerebbero il Computer Fraud and Abuse Act, una legge statunitense con precedenti specifici per i casi di web scraping.

Qualche dettaglio tecnico

GPTBot può essere identificato dal seguente user agent:

User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot){codeBox}
 

Per impedire a GPTBot di accedere al tuo sito, puoi aggiungere GPTBot al file robots.txt:

User-agent: GPTBot
Disallow: /{codeBox}

Per consentire a GPTBot di accedere solo a parti del tuo sito, puoi aggiungere il token GPTBot al file robots.txt in questo modo:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/{codeBox}



Per riassumere, il futuro dell'intelligenza artificiale e della raccolta dati è in continua evoluzione. Con aziende come OpenAI che spingono i confini della tecnologia, è fondamentale trovare un equilibrio tra innovazione e rispetto della privacy. L'arrivo di GPTBot, se utilizzato correttamente, potrebbe rappresentare un passo avanti significativo in questo delicato equilibrio.

1 Commenti

  1. Sono felice che qualcun altro parla della gravità di questa azione... tra l'altro a pochi giorni da creazione dell'ente di controllo in cui proprio OpenAi è fondatrice...

    RispondiElimina