Den seneste tid er der kommet en række retssager mod Microsoft og OpenAI samt Ai-billedgeneratoren Midjourney. Alle sagerne omhandler copyright, da sprogmodellerne, der driver AI-værktøjerne, er baseret på en lang række data og indhold, der er skabt af andre.
Nu indrømmer skaberen af ChatGPT, OpenAI, at det ikke ville kunne lade sig gøre at skabe AI-værktøjer som ChatGPT, hvis der skulle tages hensyn til ophavsret.
Det fremgår af et svar, OpenAI har givet til det britiske parlament og digitaliseringsudvalg.
”Fordi ophavsret i dag dækker stort set alle slags menneskelige udtryk - inklusive blogindlæg, fotografier, forumindlæg, stumper af softwarekode og offentlige dokumenter – ville det være umuligt at træne nutidens førende AI-modeller uden at bruge ophavsretligt beskyttet materiale,” skriver OpenAI og fortsætter:
”Begrænsning af træningsdata til offentlige bøger og tegninger skabt for mere end et århundrede siden kan give et interessant eksperiment, men det ville ikke give AI-systemer, der opfylder behovene hos nutidens borgere.”
Selskabet mener dog at have loven på sin side
”Ved træning af vores modeller overholder OpenAI kravene i alle gældende love, inklusive love om ophavsret. Ikke desto mindre, selvom vi mener, at lovgivningen om ophavsret ikke forbyder uddannelse, erkender vi også, at der stadig er arbejde at gøre for at støtte og styrke skabere,” skriver selskabet.
Det juridiske aspekt skal nok blive afklaret i den kommende tid i forbindelse med en række retssager.
En af de retssager, der er i gang mod OpenAI er mod New York Times, som har sagsøgt selskabet for at træne sprogmodeller på mediets artikler.
Her har OpenAI meldt følgende ud i et blogindlæg: "Vi støtter journalistik, samarbejder med nyhedsorganisationer og mener, at New York Times-retssagen er uden berettigelse."
Selskabet mener ikke, at New York fortæller hele historien fra de to parters dialoger.
Dertil er en af OpenAI’s argumenter, at det er såkaldt ”fair use” at træne sprogmodeller på indhold.