News Urheberrechtsverletzungen durch AI: Britannica und Merriam-Webster verklagen Perplexity

Die beiden einfach aufzukaufen dürfte für Perplexity günstiger sein, als ein Rechtsstreit ;)
 
  • Gefällt mir
Reaktionen: Kuristina
Glaub ich nicht. Da wird beim Rechtsstreit nicht viel bei rumkommen. Aber witzige Vorstellung. ^^
 
Cool Master schrieb:
Zumal in Deutschland muss niemand hungern oder Obdachlos sein.
Es erscheint mir kein gutes Konzept zu sein, Menschen die aufgrund von Urherberrechtsverletzungen nicht mehr von ihrer Arbeit leben können zu raten, von €563 Bürgergeld zu leben damit sie ihre Arbeit weiterhin gratis der Menschheit zur Verfügung stellen können. Zumal das dann eh nur für Deutschland gelten würde, bei weitem nicht alle Länder dieser Welt haben so gute Sozialleistungen, dass man damit auch überleben kann.

Bezüglich PayWall: Wenn ich den Artikel richtig im Kopf habe geht es auch darum, dass die KI die Informationen unerlaubt benutzt hat, obwohl sie hinter einer Paywall waren.
 
  • Gefällt mir
Reaktionen: tso, tritratrullala, Tanne und 4 andere
Blutschlumpf schrieb:
Man kann ja kaum erwarten, dass ein Anbieter von Suchmaschinen oder KI-Tools mit Millionen von Webseitenbetreibern irgendwelche Deals aushandelt um deren Daten zu nutzen.
Dann kann man auch erwarten, dass sie die Daten nicht nutzen.
Blutschlumpf schrieb:
Hier mag es um große Firmen gehen, aber vom Prinzip würde das ja auch Tanti Uschis Website mit Strickanleitungen (ca. 28 Besucher / Monat) betreffen solange die da Werbung oder nurn nen Affiliate-Link drauf hat.
Sie können ja alternativ einfach Uschis entgangene Durchschnittseinnahmen monatlich an Uschi uberweisen.

Oder einfach Uschis Werke nicht nutzen.

Ist ein wilder take, ich weiß.
 
  • Gefällt mir
Reaktionen: tritratrullala, Tanne, Kitsune-Senpai und eine weitere Person
Cool Master schrieb:
Ja, genau das war doch der Grundgedanke des Internets: freier Zugang zu Wissen, offener Austausch und gemeinsames Weiterentwickeln von Informationen. Dass jetzt ausgerechnet Anbieter von Wörterbüchern oder Lexika klagen, ist schon etwas paradox. Sprache, Fakten und Allgemeinwissen gehören niemandem exklusiv.

Niemand verbietet Seiten, weiterhin Inhalte zu erstellen der Schritt zur Paywall oder zu anderen Geschäftsmodellen ist doch längst gemacht. Warum sollte plötzlich niemand mehr Inhalte bereitstellen können?

Natürlich ist nachvollziehbar, dass manche Seitenbetreiber sich benachteiligt fühlen, wenn ihre Inhalte von KI-Systemen genutzt werden vor allem, wenn das ohne erkennbare Gegenleistung passiert. Aber daraus zu schließen, dass deshalb bald niemand mehr Seiten betreiben kann, ist doch etwas überzogen.

Klar, deine Perspektive als Seitenbetreiber ist absolut verständlich aber genau da liegt auch ein gewisser Bias. Wer selbst betroffen ist, sieht die Entwicklung natürlich durch die Brille der eigenen Verluste oder Veränderungen und Menschen sind hakt Gewohnheitstiere und kommen nicht gut mit Veränderung, vor allem schneller Veränderung wie z.B. KI, zurecht.

Dass sich Dinge verändern, gerade durch technologische Entwicklungen, ist nichts Neues. Es gab wie gesagt schon Beschwerden, als Google angefangen hat, Suchergebnisse direkt zu beantworten, ohne dass man die Seiten anklicken musste. Trotzdem gibt es weiterhin erfolgreiche Webseiten, Blogs und Plattformen. Warum? Weil sich viele angepasst haben, neue Wege gefunden haben, ihre Inhalte zu präsentieren oder zu monetarisieren.

Wie in jedem Unternehmen muss man sich eben mit der Zeit anpassen wer das nicht tut, bleibt irgendwann stehen, unabhängig davon, ob es um neue Technologien, verändertes Nutzerverhalten oder den Wettbewerb im Netz geht.

Man muss unterscheiden zwischen freier Zugänglichkeit von Wissen und der kommerziellen Nutzung fremder Inhalte. Dass Sprache, Fakten und Allgemeinwissen niemandem gehören, stimmt. Aber die konkrete Aufbereitung, Strukturierung und Präsentation dieser Inhalte ist eben das Ergebnis von Arbeit.

Hinter einem Lexikon-Artikel oder einer Wörterbuchdefinition stehen Menschen, die recherchieren, redigieren, aktualisieren und Qualitätssicherung betreiben.

Wenn eine KI diesen Content einfach abgreift und in eigene Antworten gießt, dann entsteht der Eindruck, als sei das Wissen "von alleine da". Tatsächlich steckt dahinter aber die redaktionelle Arbeit, die jemand bezahlt hat. Genau diese Arbeit wird entwertet, wenn KIs die Ergebnisse weitergeben, ohne dass die ursprünglichen Produzenten irgendeine Form der Gegenleistung bekommen.

Das Argument "die Seiten können doch Paywalls einführen" ist zu kurz gedacht. Denn wenn Ki Dienste systematisch Inhalte zusammenfassen, verlieren Seiten massiv an Sichtbarkeit und Reichweite. Warum sollte jemand noch eine kostenpflichtige Seite besuchen, wenn er das Destillat sowieso schon gratis über eine KI bekommt? Damit verschiebt man das komplette Gleichgewicht im Netz.

Google hat damals zwar auch Antworten direkt angezeigt, aber die Inhalte kamen trotzdem noch in großen Teilen von den Seiten selbst, und es gab weiterhin Traffic. Bei KI-Diensten ist es anders... Dort wird der Content extrahiert, neu verpackt und als eigene Leistung ausgegeben. Das ist ein qualitativer Unterschied und macht es für die ursprünglichen Anbieter nahezu unmöglich, ihr Geschäftsmodell aufrechtzuerhalten.

Wissen mag frei sein, aber die kuratierte Form von Wissen ist nicht frei entstanden. Ohne die Menschen, die Inhalte erstellen, prüfen und aktuell halten, gibt es auch keine verlässliche Basis, die KIs nutzen können. Wenn diese Arbeit nicht mehr finanzierbar ist, dann versiegt irgendwann auch die Quelle, aus der KI Systeme schöpfen.

Dann stehen wir da mit Systemen, die scheinbar alles wissen, aber in Wahrheit nur Fragmente weitergeben.. Sie halluzinieren Geschichte, Fakten und Zusammenhänge, weil niemand mehr die Inhalte prüft oder aktuell hält.

Edit: Zumal es auch noch Wikipedia gibt. Ohne Spenden, die in die Millionen gehen könnte man so eine Seite auch nicht mehr betreiben.
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: aspro, ComputerJunge, tritratrullala und 3 andere
Cool Master schrieb:
Ja, genau das war doch der Grundgedanke des Internets: freier Zugang zu Wissen,
Und wer bezahlt die Kosten dafür?
 
  • Gefällt mir
Reaktionen: aspro, tritratrullala, Kitsune-Senpai und eine weitere Person
Schmarall schrieb:
Genau da muss sich halt etwas ändern. Meiner Ansicht nach werden dennoch Dinge hergestellt - so wie früher im Internet übrigens auch, bevor es durchkommerzialisiert wurde - weil die Leute dazu ein Grundbedürfnis haben. Aber warum nicht einfach so:
Jeder kann sich beim anderen einfach so bedienen (hier also die KI bei der Enzyklopädie) und bei erwirtschaftetem Gewinn wird dann auch automatisch ein Teil ausgeschüttet?
Damit wirst Du aber nur wenige professionelle Inhalte bekommen. Warum soll ich mir auf meiner Seite die Arbeit machen, wenn andere sich einfach daran bedienen und bei mir die Leser ausbleiben? Ich verdiene nicht mal was mit der Seite, aber warum soll ich mit für andere die Arbeit machen?

Zudem habe ich von Musik geschrieben, nicht Samples. Kleiner Unterschied.
 
  • Gefällt mir
Reaktionen: aspro, tritratrullala, Kitsune-Senpai und eine weitere Person
Cool Master schrieb:
Die Zeit hat man.
Bitte? Jemand, der eine Seite betreibt und gerade mal davon leben kann, hätte die Zeit nicht, wenn er für seinen Lebensunterhalt noch anders wo arbeiten muss. Ich glaube, Du hast keine Ahnung davon, wie aufwendig es ist, eine einigermaßen "erfolgreiche" Seite im Netz aufzubauen.
 
  • Gefällt mir
Reaktionen: aspro, tritratrullala, Kitsune-Senpai und 2 andere
Cool Master schrieb:
Zumal in Deutschland muss niemand hungern oder Obdachlos sein.
Da gibt es genügend betroffene Menschen, die da anderer Meinung sind. Woher hast Du die "Erkenntnis"? Bauchgefühl?
 
  • Gefällt mir
Reaktionen: aspro, tritratrullala, Kitsune-Senpai und 3 andere
mischaef schrieb:
Manche machen sich also die Arbeit und andere können diese einfach nutzen? Schon mal daran gedacht, dass KI-Bots irgendwann dann nichts mehr haben, was sie durchsuchen können, weil keiner mehr da ist, der solche Seiten betreiben kann?
Ich finde es immer wieder unglaublich, dass so vielen dieser einfache Zusammenhang einfach nicht klar wird. Was daran ist nicht zu verstehen?

Muntermacher schrieb:
Neben dem, was @mischaef schreibt, kommt hier erschwerend dazu, daß zumindest einer (Merriam-Webster laut Artikel) der beiden hinter einer Bezahlwand den Inhalt anbietet. Damit ist es nicht freizugänglicher Inhalt.
Perplexity interessiert sich nicht die Bohne, ob Daten frei zugänglich sind oder nicht. Aravind Srinivas, CEO von Perplexity, hat in einem Interview mehr oder weniger zugegeben, dass von Perplexity beauftragte Webcrawler auch die robots.txt von Webservern (damit wird Webcrawlern mitgeteilt, ob der Inhalt öffentlich ist und indiziert werden darf) ignoriert würde:
Perplexity is not ignoring the Robot Exclusions Protocol and then lying about it,” said Perplexity cofounder and CEO Aravind Srinivas in a phone interview Friday. “I think there is a basic misunderstanding of the way this works,” Srinivas said. “We don’t just rely on our own web crawlers, we rely on third-party web crawlers as well.”
[...]
Asked if Perplexity immediately called the third-parter crawler to tell them to stop crawling Wired content, Srinivas was non-committal. “It’s complicated,” he said.
Jo, wenn man einfach nur jemand anderen für die Drecksarbeit bezahlt, geht das na klar in Ordnung. Was soll man machen. It's complicated.


Spaßeshalber habe ich Perplexity mal zum Thema befragt:
Should web crawlers be allowed to process data that is excluded from indexing via robots.txt?
Perplexity AI schrieb:
Web crawlers should not process data excluded from indexing via robots.txt, as the robots.txt file serves as a clear directive to compliant crawlers to avoid certain areas of a website and respect the webmaster’s preferences.
[...]
Robots.txt does not enforce access restrictions, and some non-compliant or malicious bots may ignore these guidelines.
 
  • Gefällt mir
Reaktionen: Tanne und Kitsune-Senpai
Cool Master schrieb:
Ich hoffe, dass die Klage scheitert. Das ist der gleiche misst wie damals beim Leistungsschutzrecht für die Presse.
Ich sehe es genau um 180 Grad anders. KI fischt kostenlos ab, was andere mühsam recherchiert und aufgebaut haben. Das geht mal gar nicht!
Wer ist denn irgendwann in naher Zukunft noch so dumm, wirklich neue Inhalte und neues Wissen ins Internet zu stellen? Woher nehmen dann all die superklugen KIs neues, gut dokumentiertes, korrektes Wissen?
 
Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: tritratrullala, Tanne, mischaef und 2 andere
mischaef schrieb:
Manche machen sich also die Arbeit und andere können diese einfach nutzen?
Als Mensch suchst du Informationen ebenfalls aus X Quellen zusammen und erstellst daraus einen Text, der (hoffentlich) interessante News oder Fragestellungen bündelt. Warum sollte eine KI das nicht dürfen?

Das Einzige, was tatsächlich rechtliche Konsequenzen haben sollte, wäre das direkte Plagiat und das Auslassen der verwendeten Quellen. So wie es bei Menschen ebenfalls der Fall ist: wenn der Journalist mal wieder 80% dpa verwendet hat und dpa nicht zitiert, bekommt der ja ebenfalls Probleme.

ChatGPT und Gemini gehen ja auch immer weiter dazu über, Quellen zu nennen und zu verlinken. Insbesondere, wenn Web-Inhalte verwendet werden. Das wird alleine schon wegen der Nachverfolgbarkeit zum neuen Standard werden - und für den rechtlichen Aspekt ebenso sinnvoll.

mischaef schrieb:
Schon mal daran gedacht, dass KI-Bots irgendwann dann nichts mehr haben, was sie durchsuchen können, weil keiner mehr da ist, der solche Seiten betreiben kann?
Das wird nie passieren. Erstmal ist unklar, ob "herkömmliche Quellen" tatsächlich in Zukunft "versiegen". Das würde ja bedeuten, dass der gesamten kostenfreien Community wie auch den professionellen Journalisten NICHTS einfällt, irgendwie an einer Monetarisierung teilzuhaben oder ein Konkurrenzangebot auf die Beine zu stellen.

Das viel fundamentalere Argument aber ist: der Bedarf ist immer da, denn natürlich will man KI mit neuen Daten füttern. Ergo wird dieser Bedarf auch gedeckt werden, selbst wenn der Journalismus als solches verschwindet. Denn Bedarf + Kapital bedeutet, dass auch eine Lösung gefunden werden wird. Und sei es das man dann speziell für "KI Datensätze" menschliche Schreiberlinge einstellt, die kuratiert neue Daten produzieren.

mischaef schrieb:
Ziemlich einseitige Sichtweise in meinen Augen. Und das sage ich als Seitenbetreiber, der mittlerweile auch von solchen Dingen betroffen ist.
Sehe ich anders. Insbesondere von professioneller Seite sehe ich vom Journalismus fast ausschließlich ein "weiter so", ein festhalten am alten Business und allenfalls mal Klagen und Ähnliche Versuche, den Fortschritt aufzuhalten.

Wie gut das funktioniert, kann einem jedes insolvente Unternehmen der Welt berichten: "was passiert", wenn man sich gegen den Markt und gegen den Fortschritt stellt. Sollte der Journalismus auch weiterhin wie z.B. Loewe damals auf die Röhren-TVs aus dem 20. Jahrhundert setzen, dann sieht die Zukunft des Journalismus im 21. Jahrhundert genauso aus, wie die von Loewe als diese "neumodischen Flatscreens" auf den Markt kamen.
 
Zuletzt bearbeitet:
ascer schrieb:
ChatGPT und Gemini gehen ja auch immer weiter dazu über, Quellen zu nennen und zu verlinken. Insbesondere, wenn Web-Inhalte verwendet werden. Das wird alleine schon wegen der Nachverfolgbarkeit zum neuen Standard werden - und für den rechtlichen Aspekt ebenso sinnvoll.
Die Seiten werden trotzdem nicht mehr angeklickt und so entgehen Einnahmen. Inhalte erstellen sich nicht von selbst, sondern die Autoren sollen bezahlt werden.

Auch wurden die Seiten nicht entlohnt, als die Inhalte gecrawled wurden.
 
Zuletzt bearbeitet: (Typo)
  • Gefällt mir
Reaktionen: tritratrullala und mischaef
rarp schrieb:
Ich finde es immer wieder unglaublich, dass so vielen dieser einfache Zusammenhang einfach nicht klar wird. Was daran ist nicht zu verstehen?
Mir scheint es dabei eher, das andere das Problem nicht erkennen. Wenn andere sich ungefragt an meinen Inhalten bedienen und bei mir auf der Seite die Zugriffe ausbleiben, warum soll ich dann noch Inhalte erstellen? Ergo höre ich irgendwann damit auf und die Bots können sich bei mir nicht mehr bedienen.

Wem ist damit also geholfen?

@ascer
Das stimmt so eben auch nicht. Es gibt viele Inhalte, die größtenteils aus eigenen Erkenntnissen generiert werden. Wenn ich hier auf CB einen Test schreibe, dann nutze ich natürlich auch fremdes Wissen, aber es steckt auch viel eigene Arbeit in dem Text. Darum geht es.

Und ja, besonders im Nerd-Bereich wird es dann deutlich weniger Inhalte geben. Und irgendwann crawlen die Bots nur ihr eigenes halluziniertes Zeugs.
 
  • Gefällt mir
Reaktionen: aspro, tritratrullala und Alphanerd
Beelzebot schrieb:
Und du glaubst ernsthaft, dass Google und Konsorten was von ihren "hart" erwirtschafteten Milliarden abgeben? Viele viele Seiten leben von Klicks mit Werbung. Sind das nur noch Klicks von Bots und KI, fragen sich die Unternehmen, warum sie überhaupt Geld für Werbung ausgeben. Sie könnten die KI selber aus ihrer Presseabteilung mit ihrem Zeug und ihrer Anschauung füttern und die Nutzer würden das dann als Ergebnis bekommen. Finde ich jetzt nicht ideal muss ich sagen.
Wenn sie es müssen? Ja.
Und ich kann nicht verstehen, wie überhaupt ein Mensch auf diesen Werbemist klicken kann. Wäre doch wünschenswert, wenn sie die Werbung seinlassen würden.

mischaef schrieb:
Damit wirst Du aber nur wenige professionelle Inhalte bekommen. Warum soll ich mir auf meiner Seite die Arbeit machen, wenn andere sich einfach daran bedienen und bei mir die Leser ausbleiben? Ich verdiene nicht mal was mit der Seite, aber warum soll ich mit für andere die Arbeit machen?

Zudem habe ich von Musik geschrieben, nicht Samples. Kleiner Unterschied.
Na dann machst du es halt nicht mehr. Ich weiß nicht was du machst und will dir keinesfalls zu nahe treten, aber die Frage ist auch, ob dann etwas relevantes wegfällt.

Zur Musik: Damit meinte ich, dass man sich bei der Musik von anderen auch jetzt schon bedienen darf.
 
Kuristina schrieb:
Ja, aber das ist ja reines Wunschdenken. Du wirst nie alle Staaten unter einen gemeinsamen Regelhut bekommen.

Irgendwo muss man anfangen. Nur weil es nicht 100% funktioniert ein "laissez-faire"? Das kann doch nicht der Grundsatz für Gesetzgebung sein.

Cool Master schrieb:
Ja, genau das war doch der Grundgedanke des Internets: freier Zugang zu Wissen, offener Austausch und gemeinsames Weiterentwickeln von Informationen.

Ja, aber nur zu Wissen, was freiwillig gegeben wird. Da ging es nicht um "abschnorren" von Wissen.

Cool Master schrieb:
Sprache, Fakten und Allgemeinwissen gehören niemandem exklusiv

Schon, aber die Verlage haben sich Arbeit damit gemacht, Fakten zu recherchieren. Und das ist nicht wenig Arbeit, wenn es gut gemacht ist.
Wenn es niemandem exklusiv gehört und jeder auf dieses Wissen, unabhängig von den Verlagen, hat, bräuchte man ja nicht ausgerechnet auf die Faktendarstellung der Verlage zugreifen sondern kann die "Eigenkreation" reinstellen.

Cool Master schrieb:
Man wird KI nicht aufhalten können es muss sich daher in der Gesellschaft etwas verändern nicht bei der Technik.

Das ist das Pferd in meiner Sicht verkehrt herum aufgezäumt. Man kann auch sagen "Die Werte in unserer Gesellschaft sind uns heilig und wenn es neue Technologien gibt, muss diese sich an die bestehenden Regeln und Gesetze halten." Wenn die Technologie nicht will oder kann, dann passt es eben nicht.
 
  • Gefällt mir
Reaktionen: Alphanerd und mischaef
Schmarall schrieb:
Na dann machst du es halt nicht mehr. Ich weiß nicht was du machst und will dir keinesfalls zu nahe treten, aber die Frage ist auch, ob dann etwas relevantes wegfällt.
Bei mir sicherlich nicht. Aber glaubst Du wirklich, dass ich dann der einzige sein werde? Das bezweifle ich.
Schmarall schrieb:
Zur Musik: Damit meinte ich, dass man sich bei der Musik von anderen auch jetzt schon bedienen darf.
Nein, eben nicht. Du darfst Dich einzelner "Segmente" bedienen, der ganzen Musik aber nicht so einfach - zumindest nicht ohne Gebühren zu zahlen.
 
  • Gefällt mir
Reaktionen: Alphanerd
Schmarall schrieb:
Zur Musik: Damit meinte ich, dass man sich bei der Musik von anderen auch jetzt schon bedienen darf.
Hast du da mal eine Quelle zu? Weil abgesehen von kurzen Samples zahlt man meines Wissens nach ordentlich, wenn man zB wie bei "Anxiety" (original: somebody that I used to know) quasi das ganze Lied übernimmt.
Ergänzung ()

Schmarall schrieb:
Na dann machst du es halt nicht mehr. Ich weiß nicht was du machst und will dir keinesfalls zu nahe treten, aber die Frage ist auch, ob dann etwas relevantes wegfällt.
Ich sehe das anders. Man macht etwas gerne, investiert Zeit und macht ein paar (oder auch paar mehr) Mücken damit. Jetzt kommt eine neue Technologie und deine Arbeit wird einfach ohne den Gegenwert des Werbungsschauens genommen.
 
  • Gefällt mir
Reaktionen: mischaef
@Alphanerd
Ja, jetzt. Es gab hier aber Stimmen, die meinten, dass das aber auch kostenlos sein soll. Darum ging es - um die Arbeit anderer. Warum soll z.B. ein Hersteller, der einen CD-Sampler rausbringt, damit Geld verdienen, aber der, der die Musik gemacht hat und ohne dessen Arbeit es diese CD gar nicht geben würde, soll nichts bekommen?
 
  • Gefällt mir
Reaktionen: Land_Kind
mischaef schrieb:
Nein, eben nicht. Du darfst Dich einzelner "Segmente" bedienen, der ganzen Musik aber nicht so einfach - zumindest nicht ohne Gebühren zu zahlen.
Ja, ich sage ja: samplen.

Alphanerd schrieb:
Hast du da mal eine Quelle zu? Weil abgesehen von kurzen Samples zahlt man meines Wissens nach ordentlich, wenn man zB wie bei "Anxiety" (original: somebody that I used to know) quasi das ganze Lied übernimmt.

Schaut mal nach beim ewigen Gerichtsstreit von Moses Pelham gegen Kraftwerk.
 
Zurück
Oben