Si scaldano i motori del W3C, il consorzio che sviluppa gli standard del web, in vista dell’adozione da parte degli Stati europei della direttiva copyright prevista a giugno. Sarà l’italiana Giulia Marangoni, in nome dell’Associazione Italiana Editori e il francese Laurent Le Meur della EdrLab, a fare da co-Chair del Community Group attivato nell’ambito W3C.
Il gruppo, sostenuto della Federazione degli editori europei e dalla associazione francese degli editori, punta a individuare i protocolli tecnologici che consentono agli editori di tutelare i diritti sui contenuti disponibili online rispetto all’utilizzo per il text and data mining, l’analisi automatizzata di testi e dati tramite algoritmi da parte, fra gli altri, delle big tech.
Big data per la profilazione
“Text and Data Mining Reservation Protocol ” è il nome del Community Group targato W3C che nasce in vista dell’adozione da parte degli Stati europei della direttiva copyright che all’articolo 4 introduce una nuova eccezione al diritto d’autore per l’utilizzo dei contenuti online per obiettivi di text and data mining per finalità commerciali, inclusa quindi la raccolta di big data necessaria a istruire le intelligenze artificiali o con obiettivi di profilazione e ricerca statistica.
L’eccezione prevede che tale utilizzo dei contenuti liberamente consultabili sul web sia sempre consentito a meno che non venga espressamente riservato dagli aventi diritto.
La riserva dei diritti per il text and data mining può essere effettuata tramite strumenti “machine readable”, ovvero stringhe di codice presenti nei siti, ma la direttiva non entra nel dettaglio dei formati e dei protocolli da utilizzare.
Soluzioni a disposizione di editori e big tech
Per questo il Community Group si propone di individuare soluzioni semplici e basate sugli standard in uso nel web: spetterà poi agli editori decidere di adottarle o meno. Tali soluzioni potranno consentire sia di riservare i diritti sia di comunicare le eventuali licenze disponibili, facilitando lo sviluppo di applicazioni basate sull’uso legittimo dei contenuti protetti dal diritto d’autore.
“È interesse dei detentori dei diritti così come delle aziende tecnologiche adottare soluzioni condivise che consentono una gestione ordinata e senza contenziosi di questa materia – ha spiegato Giulia Marangoni – per questo auspichiamo che la partecipazione all’iniziativa sia il più ampia possibile: il gruppo è aperto, non occorre essere membri W3C e ci si può iscrivere online”.
Obiettivo una soluzione automatizzata
Le tecniche di estrazione di testo e dati, si legge nel sito del W3C, “sono ampiamente utilizzate da enti pubblici e privati per analizzare grandi quantità di dati (inclusi contenuti protetti da copyright come testo, immagini, video ecc.) in diversi ambiti e per vari scopi, inclusi servizi governativi, decisioni aziendali complesse e sviluppo di nuove applicazioni o tecnologie”.
In un ambiente digitale, l’utilizzo di tecniche di estrazione di opere protette da copyright può essere soggetto a termini e condizioni diversi, a seconda del quadro giuridico. Le leggi internazionali stabiliscono che l’atto di riproduzione è soggetto all’autorizzazione dei titolari dei diritti. Ma “finora – dicono al W3C -, analizzare ed elaborare i termini e le condizioni di un sito web, contattare i titolari dei diritti, chiedere il permesso e concludere accordi di licenza richiedono tempo e risorse”.
Serve dunque “una soluzione automatizzata che razionalizzi la comunicazione dei diritti e delle licenze Tdm disponibili per i contenuti protetti da copyright per facilitare lo sviluppo di applicazioni Tdm e ridurre i rischi di incertezza giuridica per i vari player. Tale soluzione, che si baserà sul consenso dei titolari dei diritti e dei player Tdm, ottimizzerà la capacità delle aziende di accedere legalmente ed elaborare contenuti utili su larga scala”.