Violazione copyright: due autori denunciano Apple

Nello stesso giorno in cui Anthropic ha sottoscritto un accordo extragiudiziale, Apple è stata denunciata da due autori per violazione di copyright. L’azienda di Cupertino è accusata di aver addestrato i suoi modelli AI con copie pirate di libri incluse nel dataset RedPajama.
OpenELM: addestramento pirataNella denuncia (PDF) presentata dagli avvocati per conto di Grady Hendrix e Jennifer Roberson è scritto che Apple ha usato il dataset RedPajama per addestrare i modelli open source OpenELM, disponibili da oltre un anno su Hugging Face. La conferma arriva direttamente dal documento pubblicato dalla stessa azienda di Cupertino.
Uno dei dataset inclusi in RedPajama è Books che a sua volta è una copia di Book3 (parte della compilation The Pile di EleutherAI) . Quest’ultimo contiene copie pirata di libri di Bibliotik, una delle più note “biblioteche ombra” online. Book3 contiene circa 196.640 libri, tra cui quelli pubblicati dai due autori. Apple ha in pratica ammesso di aver usato copie pirata per addestrare i modelli OpenELM.
In un caso analogo, relativo all’uso dei sottotitoli dei video pubblicati su YouTube, Apple aveva dichiarato che OpenELM non viene utilizzato per nessuna funzionalità AI, quindi non ottiene un profitto. Secondo gli avvocati degli autori, l’azienda di Cupertino avrebbe utilizzato il dataset Booke per addestrare anche i modelli usati per Apple Intelligence, da cui viene invece ottenuto un guadagno.
Nella denuncia è scritto che Apple ha violato il copyright non avendo ottenuto il permesso degli autori e pagato un compenso. Gli avvocati chiedono pertanto al giudice di approvare lo status di class action, ordinare la distruzione dei dataset e dei modelli, un’ingiunzione permanente per impedire la condotta illegale, un risarcimento danni e il rimborso delle spese legali.
Punto Informatico