Quickloox

Dal mondo Apple all'universo digitale, in visualizzazione rapida dell'ovvio

20 giu 2024 - Software Internet AI

Più che dati, presi

Con tutti i difetti che può avere, nel campetto Apple cresce erba migliore di quella degli altri e per esempio trovo positive le reazioni diffuse suscitate dal fatto che, per ammissione della dirigenza, i modelli dentro Apple Intelligence sono stati addestrati con dati semplicemente presi dalla rete, senza troppi scrupoli.

Michael Tsai ha giustappunto raccolto una serie di interventi in tema che coprono il caso Apple, ma non solo. Siccome è Apple, fa più rumore, a differenza che in altri casi in cui il fatto era noto ma non si vedeva necessità di disturbare il manovratore.

Chi più chi meno, qualsiasi modello linguistico esistente è stato addestrato pescando a strascico nel web. Articolo dopo articolo, si scopre che adesso vari modelli consentono a un sito di non farsi scandire. Si scopre pure che in altre situazioni, dalle parti di Google, è praticamente impossibile sfuggire all’esplorazione a meno di uscire tout court dagli indici di Google stesso.

Altri soggetti sostengono di non fare scraping selvaggio e intanto lo fanno. Il massimo è Perplexity, che addirittura lo fa clandestinamente attraverso un numero IP tenuto nascosto all’esterno.

Ma come? Obiettano molti. I dati sul web sono pubblici, a disposizione di chiunque. E poi gli Llm non copiano in output i dati stessi, quindi neanche violano il copyright…

Sarà interessante vedere a questo proposito come finisce la causa intentata dal New York Times contro OpenAI.

Sì, lo scraping si è sempre fatto, i dati sono sempre stati presi e rielaborati; ma l’entità e la scala di questa applicazione dello scraping è senza precedenti. E qualsiasi sia la situazione di fatto attuale, lo sviluppo positivo del diritto può andare solo verso la discrezione di chi ha prodotto i dati in prima istanza e deve poter avere ragionevole voce in capitolo su eventuali utilizzi successivi.

La privacy si avvicina sempre più a fare da spartiacque tra mondo evoluto e mondo arretrato.

Commenta