Le New York Times poursuit OpenAI et Microsoft pour violation du droit d'auteur

Le New York Times poursuit OpenAI et Microsoft pour violation du droit d'auteur

Le journal officiel affirme que des millions de ses articles n'étaient pas autorisés à former ChatGPT et les autres outils d'IA de l'entreprise.

Le New York Times a poursuivi mercredi Microsoft et OpenAI, le créateur de ChatGPT, pour violation du droit d'auteur, accusant les deux sociétés d'avoir « utilisé illégalement le travail du Times pour créer des produits d'intelligence artificielle » qui concurrencent le travail du média et « menacent » son capacité à fournir un journalisme indépendant.

La poursuite affirme que les outils d'IA générative créés par Microsoft et OpenAI s'appuient sur de grands modèles de langage, ou LLM, « qui ont été construits en copiant et en utilisant des millions d'articles de presse protégés par le droit d'auteur du Times, des enquêtes approfondies, des articles d'opinion, des critiques, comment -aux guides et plus encore.

« Alors que les accusés se livraient à des copies à grande échelle à partir de nombreuses sources, ils ont accordé une importance particulière au contenu du Times lors de la création de leurs LLM – révélant une préférence qui reconnaît la valeur de ces œuvres », peut-on lire dans la plainte déposée devant le tribunal de district américain du district sud de New York. York, a déclaré. « Grâce à Bing Chat de Microsoft (récemment rebaptisé « Copilot ») et à ChatGPT d'OpenAI, les accusés cherchent à profiter gratuitement de l'investissement massif du Times dans son journalisme en l'utilisant pour créer des produits de substitution sans autorisation ni paiement.

Bien que ce ne soit pas la première poursuite intentée contre des sociétés d'IA pour leur utilisation de matériel publié – un large éventail d'écrivains et d'autres créateurs, de la comédienne Sarah Silverman à l'auteur chrétien et ancien gouverneur de l'Arkansas Mike Huckabee, ont intenté des poursuites pour violation du droit d'auteur – le Times est le premier grand média américain à s’en prendre aux plateformes d’IA.

Fait unique, le Times affirme que les produits d’IA générative « menacent un journalisme de haute qualité ».

« Si le Times et d’autres organes de presse ne peuvent pas produire et protéger leurs
journalisme indépendant, il y aura un vide qu’aucun ordinateur ou intelligence artificielle ne pourra combler », indique la plainte.

Dans son propre rapport sur la poursuite, le Times a déclaré qu’il pourrait également tester « les contours juridiques émergents des technologies d’IA générative » et « pourrait avoir des implications majeures pour l’industrie de l’information ».

La plainte, qui intervient quatre mois après que le Times a interdit l'utilisation de son contenu pour entraîner des systèmes d'IA, affirme que les entreprises ont « refusé de reconnaître » la forte protection des droits d'auteur prévue par la loi américaine.

« Alimentés par des LLM contenant des copies du contenu du Times, les outils GenAI des accusés peuvent générer un résultat qui récite le contenu du Times textuellement, le résume fidèlement et imite son style expressif, comme le démontrent de nombreux exemples », y compris plusieurs pièces incluses comme pièces à conviction dans la poursuite.

« Ces outils attribuent également à tort de fausses informations au Times », indique la poursuite.

En outre, la recherche Bing de Microsoft « copie et catégorise le contenu en ligne du Times, pour générer des réponses contenant des extraits textuels et des informations détaillées ».
des résumés d'articles du Times qui sont nettement plus longs et plus détaillés que ceux renvoyés par les moteurs de recherche traditionnels », affirme la poursuite.

« En fournissant du contenu au Times sans la permission ou l'autorisation du Times, les outils des accusés sapent et nuisent à la relation du Times avec ses lecteurs et privent le Times de revenus d'abonnement, de licence, de publicité et d'affiliation », poursuit-il. La poursuite indique que le Times comptait environ 10,1 millions d’abonnés au 30 septembre et vise 15 millions d’ici la fin de l’année 2027.

La plainte ne comporte pas de demande monétaire, mais souligne qu'utiliser ainsi le travail du Times sans payer « a été extrêmement lucratif » pour les entreprises. Il affirme que l'utilisation par Microsoft de LLM formés par le Times pour l'ensemble de sa gamme de produits « a contribué à augmenter sa capitalisation boursière d'un billion de dollars au cours de la seule année écoulée ». Et il note que « la sortie de ChatGPT par OpenAI a porté sa valorisation à 90 milliards de dollars ».

Le Times a rapporté qu'il avait tenté de parvenir à un accord négocié avec Microsoft et OpenAI depuis avril, qui pourrait impliquer un accord commercial et d'éventuels « garde-fous technologiques », de la même manière qu'il a conclu des accords avec Google, Meta et Apple, mais les négociations ont abouti à un accord. « impasse. »

« Publiquement, les accusés insistent sur le fait que leur conduite est protégée en tant qu'« usage loyal » parce que leur utilisation sans licence de contenu protégé par le droit d'auteur pour former des modèles GenAI sert un nouvel objectif « transformateur » », affirme la poursuite. « Mais il n'y a rien de 'transformateur' dans le fait d'utiliser le contenu du Times sans paiement pour créer des produits qui remplacent le Times et lui volent des audiences. »

« Parce que les résultats des modèles GenAI des accusés sont en concurrence avec et
imitent fidèlement les intrants utilisés pour les former, copier les œuvres du Times à cette fin n’est pas un usage équitable », indique la poursuite.

Les représentants de Microsoft et d'OpenAI n'ont pas immédiatement répondu aux demandes de commentaires, et les sociétés n'ont pas encore eu la possibilité de répondre devant les tribunaux.