Web+chiuso+nel+futuro%3F+sempre+pi%C3%B9+siti+limitano+l%26%238217%3Baccesso+dei+crawler+per+proteggere+i+contenuti+dalla+AI
blitzquotidianoit
/economia/web-chiuso-nel-futuro-sempre-piu-siti-limitano-laccesso-dei-crawler-per-proteggere-i-contenuti-dalla-ai-3637201/amp/

Web chiuso nel futuro? sempre più siti limitano l’accesso dei crawler per proteggere i contenuti dalla AI

 C’è un Web chiuso nel nostro futuro? sempre più numerosi sono i siti che scelgono di limitare l’accesso dei crawler per proteggere i propri contenuti dall’utilizzo senza reciprocità da parte dell’intelligenza artificiale, esiste il rischio che il Web diventi più segmentato e meno aperto. Ciò potrebbe limitare il flusso di informazioni e innovazione, mettendo in discussione l’etica fondamentale di un Internet aperto e collaborativo scrive AI Secrets.

ll file “robots.txt”, ricorda, è frutto di un accordo fondamentale ma informale che da decenni regola le attività di web crawling su Internet. Inizialmente creato per gestire l’accesso di web crawler o “robot” benigni ai siti web, il sistema si basa sul rispetto reciproco e sulla cooperazione tra amministratori web, sviluppatori e creatori di crawler.

Tuttavia, i rapidi progressi nell’intelligenza artificiale e il suo vorace bisogno di dati hanno messo a dura prova questo protocollo tradizionale, portando a preoccupazioni sull’utilizzo dei dati, sul rispetto per i creatori di contenuti originali e sull’equo scambio di valore su Internet.

Sviluppato all’inizio degli anni ’90 da Martijn Koster e colleghi, il file robots.txt era un modo semplice ed efficace per i proprietari di siti web di comunicare quali parti del loro sito erano vietate ai web crawler. Questo protocollo ha contribuito a prevenire problemi operativi come il sovraccarico del server dovuto a una scansione eccessiva e ha consentito ai siti Web di controllare la visibilità e l’utilizzo dei propri contenuti.

Inizialmente progettati per scopi benigni come l’indicizzazione del web per i motori di ricerca o l’archiviazione, i web crawler sono diventati più potenti e numerosi, con aziende come Google, Microsoft e Amazon che li utilizzano per organizzare e monetizzare i contenuti Internet. L’avvento dell’intelligenza artificiale ha introdotto nuovi tipi di crawler che raccolgono dati per addestrare modelli complessi, sollevando nuove sfide.

Ma l’emergere dell’intelligenza artificiale ha ribaltato la tradizionale relazione di dare e avere stabilita da robots.txt. Molti fornitori di contenuti ora considerano la raccolta dei dati dell’intelligenza artificiale come un affare unilaterale, in cui il loro contenuto viene utilizzato per addestrare modelli di intelligenza artificiale senza compenso o riconoscimento diretto, portando a una rivalutazione dell’accesso concesso ai crawler.

Ne sono derivate crescenti tensioni e sfide legali: l’uso unilaterale dei contenuti web da parte delle società di intelligenza artificiale per la formazione di modelli senza un chiaro compenso o consenso ha portato a sfide legali ed etiche, con organizzazioni importanti come la BBC e il New York Times che hanno adottato misure per bloccare specifici crawler e avviare azioni legali contro le aziende di intelligenza artificiale.

Si avverte, scrive ancora AI Secrets, la necessità di nuova governance e standard: il tradizionale protocollo robots.txt, sebbene fondamentale, potrebbe non essere più sufficiente nell’era dell’intelligenza artificiale. C’è una crescente richiesta di meccanismi di controllo più dettagliati che soddisfino le complessità dei casi d’uso dell’intelligenza artificiale, portando a discussioni sulla formalizzazione di nuovi standard e pratiche per la gestione dei crawler.

 

 

 

 

 

 

 

Maria Vittoria Prest

Recent Posts

Da Elodie a Vincent Cassel, il Calendario Pirelli 2025 torna al nudo

Il nuovo calendario Pirelli 2025 celebra la bellezza autentica e senza artifici, portando in primo…

17 minuti ago

Supermercati italiani, sorpresa: è questo il supermercato più conveniente (né Coop, né Esselunga)

Tanti sono i supermercati sparsi per l’Italia e noi consumatori siamo sempre alla ricerca di…

37 minuti ago

DiMartedì, il video della copertina di Luca e Paolo: “Salvini è diventato il cosplayer di Trump”

"Ha fatto molto ridere Salvini - scherzano Luca e Paolo nella consueta copertina per DiMartedì…

48 minuti ago

Marotta: “Col Napoli il rigore era ineccepibile ma il Var si può migliorare”

Beppe Marotta, presidente dell'Inter, è tornato a parlare dell’episodio tanto discusso nella recente sfida contro…

52 minuti ago

Sinner show alle ATP Finals di Torino. Schiantato anche Fritz in 2 set, semifinale ad un passo

Sinner, un altro show alle ATP Finals. Il sogno continua. Anche lo statunitense Fritz si…

1 ora ago

Morta a 22 anni dopo l’anestesia per un intervento al naso. Aveva scelto il medico su TikTok

Il 4 novembre scorso, Agata Margaret Spada, una giovane ventiduenne originaria di Lentini, in provincia…

1 ora ago