News Erfolge für Anthropic und Meta: Millionen Bücher für KI-Training zu verwenden, kann legal sein

Andy

Tagträumer
Teammitglied
Registriert
Mai 2003
Beiträge
8.213
  • Gefällt mir
Reaktionen: NMA, Kuristina und chaopanda
Also, wenn das große Konzerne machen ist das nicht illegal. Aber wehe....
 
  • Gefällt mir
Reaktionen: Randnotiz, the_IT_Guy, Aslo und 32 andere
Wenn auch nur eine gute Sache aus dem KI-Boom übrig bleibt, dann hoffentlich, dass das überkommene Urheberrecht beerdigt wird.
 
  • Gefällt mir
Reaktionen: Randnotiz, nyster, Venora Valyria und 7 andere
stevefrogs schrieb:
dann hoffentlich, dass das überkommene Urheberrecht beerdigt wird.
Für dich und mich ganz sicher nicht.
 
  • Gefällt mir
Reaktionen: Brian.Griffin, Wallwatcher, the_IT_Guy und 23 andere
Konzerne dürfen sich das erlauben, aber wenn ein Youtuber kurze Videoschnipsel von den Öffentlich-Rechtlichen verwendet um den Inhalt zu kommentieren, verteilt Google Strikes. Und das obwohl man dafür sogar zahlen muss. Wer am längeren Hebel sitzt bekommt Recht. Sehr fair alles. 🙃
 
  • Gefällt mir
Reaktionen: Melvyn, Randnotiz, Brian.Griffin und 17 andere
Das Training von AI ist einfach grundsätzlich eine beschissene Situation.
Es braucht diese enorm großen Datensätze um mit den aktuellen Ansätzen eine funktionale "AI" zu trainieren, gleichzeitig birgt diese Art der AI jedoch auch das große Potenzial den Menschen aus der Schöpfung von Texten, Bildern, Videos und Musik oder Sprache zu verdrängen und damit arbeitslos zu machen.
Künstler, Autoren usw. lernen quasi hier unentgeltlich ihre Ablösung an.

Im Prinzip dürfte diese Entwicklung nicht durch kommerzielle Firmen stattfinden um dann anschließend für Geld zur Verfügung gestellt zu werden, sondern müsste - ihren potenziellen Einfluss auf die Gesellschaft berücksichtigend - staatlich oder verstaatlicht stattfinden und der Allgemeinheit zur Verfügung stehen, siehe auch das Thema Robotersteuer.
(Um die Sache abzukürzen: Alle Wege führen zum Bedingungslosen Grundeinkommen, denn wenn "Kopfarbeit" durch AI stattfindet, Arbeit am Fließband durch Roboter, Transportleistungen durch selbstfahrende Fahrzeuge und das Essen aus der Hydroponik kommt, dann bleiben echt nicht mehr viele Jobs übrig)
 
  • Gefällt mir
Reaktionen: Viper2000, Charminbaer, Wallwatcher und 7 andere
Das Urheberrecht gehört dringend überarbeitet. Das Angehörige bis 75Jahre nach dem Tod des Urhebers noch Ansprüche stellen dürfen ist völlig überzogen.

Dennoch finde ich einen gewissen Schutz vor Content klau sinnvoll. Ich würde hier ähnliche Fristen wie für Patente sehen. 20 Jahre.

Aber bei den KI-Modellen sieht man halt auch die Doppelmoral derer die sie Erstellen. Für die Nutzung der KI horrende Monatsabos verlangen, aber sich am Content anderer Kostenlos bedienen wollen. Dann sollen ses wie bei der GEMA machen und jedes mal wenn der Content eines Urhebers genutzt wird, soll der Urheber ein paar Groschen bekommen. Gepaart mit eine Sinvollen Urheberschutz-Frist haben am Ende alle was davon.
 
  • Gefällt mir
Reaktionen: NMA, Winder, nyster und 3 andere
Urheberrechtsverletzungen sind immer böse böse, es sei denn, es macht jemad größeres, dann ist es Fair use. Dann soll die KI aber bitte auch das ganze Buch schreiben, wenn ich Ihr sage, "Schreibe mir Buch X von Autor Y"
 
  • Gefällt mir
Reaktionen: Venora Valyria
Anstelle sich auf oft ungenaue oder von Halbwahrheiten geprägte Inhalte aus menschlichen Quellen zu stützen, könnten durch den gezielten Einsatz qualitätsgeprüfter Literatur nicht nur die Genauigkeit, sondern auch die Tiefe und Verlässlichkeit des erlernten Wissens gesteigert werden. Bücher, die von Experten verfasst und durch redaktionelle Prozesse geschliffen wurden, bieten eine solide Grundlage, um KI-Systeme mit „nützlichem“ und verlässlichem Wissen auszustatten.

Aber auch hier ist der Missbrauch von "Falschinformation" keine Garantie gegeben!
 
  • Gefällt mir
Reaktionen: Schinken42, Azdak und Qyxes
Ich bin da voll dabei, das Urheberrecht gehört modernisiert. Kunstschaffende sollten nicht so übervorteilt werden durch Milliardenunternehmen. Der Schaden der der Buchbranche entsteht ist unvorstellbar und das werden die ganzen KI Verteidiger*innen spätestens dann feststellen wenn es keine neuen Bücher mehr gibt.
Freue mich schon auf die Reaktionen von euch allen wenn jedes neue Werk reiner KI Slop ist. In der Branche verdient man sowieso schon sehr wenig als Kunstschaffende Person (in der Regel sind es Cent Beträge die Autor*innen bekommen).

Ohne ihre LLMs wüssten Anthropic, Meta h d co doch nicht einmal wie Fair Use buchstabiert wird. Unmoralische Branche.
 
  • Gefällt mir
Reaktionen: NMA, LuxSkywalker, gustlegga und 2 andere
OrtusMalum schrieb:
Dennoch finde ich einen gewissen Schutz vor Content klau sinnvoll. Ich würde hier ähnliche Fristen wie für Patente sehen. 20 Jahre.
Gilt das auch für Content aus der Super Illu? Also wo fängt Content an? Schon bei dem fiktiven Interview mit Schumacher, oder Fachwissen?
 
  • Gefällt mir
Reaktionen: NMA
Sehr gute, wegweisende Entscheidung für die KI-Entwicklung.

Insbesondere dies...
Im Fall der LLMs nutzt Alsup nun den Vergleich mit dem, was Autoren ohnehin machen. Sie lesen Texte und verwenden diese Inhalte dann in irgendeiner Form. „Sie müssen vielleicht dafür bezahlen, den Text erst einmal in den Händen zu halten. Aber es wäre undenkbar, jemanden für die Nutzung eines Buchs zahlen zu lassen; jedes Mal, wenn sie es aus dem Gedächtnis abrufen, jedes Mal, wenn sie darauf zurückgreifen, um neue Dinge in einer neuen Weise zu schreiben“, so Alsup.
...war exakt meine Argumentationslinie in bereits diversen Threads.

Künstler, Autoren und überhaupt allen Menschen fallen neue Ideen nicht einfach so ein, sie lernen zuvor ihr Leben lang aus Inhalten anderer.

Wenn die Ausgabe eines LLMs urheberrechtlich geschütztes Material 1:1 kopiert, dann ist der mit dem LLM erstellte Text natürlich ein Plagiat.
Das reine Training - also Lernen aus bestehendem Material - hingegen sollte stets unbedenklich sein. Genauso wie es bei Menschen ebenfalls gängig ist. Entscheidend ist das Endergebnis, welches man verwenden möchte und nicht, wo oder wie die KI gelernt hat, solche Ergebnisse zu produzieren.
 
  • Gefällt mir
Reaktionen: NMA, Bl4cke4gle, mazO! und 2 andere
Karl S. schrieb:
Konzerne dürfen sich das erlauben, aber wenn ein Youtuber kurze Videoschnipsel von den Öffentlich-Rechtlichen verwendet um den Inhalt zu kommentieren, verteilt Google Strikes. Und das obwohl man dafür sogar zahlen muss. Wer am längeren Hebel sitzt bekommt Recht. Sehr fair alles. 🙃
Falsch.

Die werden automatisiert gestriked, in den meisten Fällen aver nach Widerspruch anstandslos wiederhergestellt
 
  • Gefällt mir
Reaktionen: MiroPoch
@OrtusMalum Ein Modell wie bei der GEMA ist leider nicht wirklich umsetzbar, da beim Output aus AI niemand mehr sagen kann wo die Zutaten herkommen. Klar, wenn da "Nein, ich bin dein Vater!" steht kann man es sich schon denken wo zitiert wurde, aber nicht alles ist so eindeutig und das würde am Ende nur zu solchen Diskussionen wie beim Rechtstreit zwischen Kraftwerk und einem Produzenten, der ein extrem kurzes Sample aus einem Kraftwerk-Song verwendete, führen. Der Rechtstreit läuft seit über 25 Jahren und tappst regelmäßig mal beim BGH vorbei...
Eher braucht man da ein Modell wie bei der VG Wort, wo man im Grunde allleine schon weil man einen Text geschrieben und veröffentlicht hat bei den Ausschüttungen berücksichtigt werden kann.
(Die VG Wort bezieht das Geld welches sie ausschüttet dann aus Urheberrechtsabgaben auf Drucker usw. Da würden wir uns dann der bereits genannten Robotersteuer annähern, wenn man das aufgrund der Verbreitung von AI auf weite Felder anwendet)
 
iSight2TheBlind schrieb:
Das Training von AI ist einfach grundsätzlich eine beschissene Situation.
Es braucht diese enorm großen Datensätze um mit den aktuellen Ansätzen eine funktionale "AI" zu trainieren, gleichzeitig birgt diese Art der AI jedoch auch das große Potenzial den Menschen aus der Schöpfung von Texten, Bildern, Videos und Musik oder Sprache zu verdrängen und damit arbeitslos zu machen.
Künstler, Autoren usw. lernen quasi hier unentgeltlich ihre Ablösung an.

Im Prinzip dürfte diese Entwicklung nicht durch kommerzielle Firmen stattfinden um dann anschließend für Geld zur Verfügung gestellt zu werden, sondern müsste - ihren potenziellen Einfluss auf die Gesellschaft berücksichtigend - staatlich oder verstaatlicht stattfinden und der Allgemeinheit zur Verfügung stehen, siehe auch das Thema Robotersteuer.
(Um die Sache abzukürzen: Alle Wege führen zum Bedingungslosen Grundeinkommen, denn wenn "Kopfarbeit" durch AI stattfindet, Arbeit am Fließband durch Roboter, Transportleistungen durch selbstfahrende Fahrzeuge und das Essen aus der Hydroponik kommt, dann bleiben echt nicht mehr viele Jobs übrig)
Zugegeben, ich kann dir nicht vorhersagen, welchen Jobs die Menschen in 100 Jahren nachgehen werden, aber ich bin mir Sicher, es wird schon genug Arbeit übrig bleiben. Es ist ja nicht das erste mal in der Menschheitsgeschichte, das Jobs durch technologischen Fortschritt nicht verloren gehen sondern durch andere Jobs ersetzt werden. Das Beste Beispiel ist Landwirtschaft. Anfang des 20. Jahrhunderts haben in Deutschland über 90% der Menschen in der Landwirtschaft gearbeitet. Praktisch JEDER musste mit anpacken, das ALLE was zu fressen haben. Nach dem 2.WK waren es immernoch rund 50-60%, zunehmend mit Zweitjobs in der Fabrik... Heute sind es noch 3%. Sind all die 87% die vor hundert Jahren noch aufm Feld stehen mussten damit alle was zwischen die Beißerschen bekommen heute Arbeitslos? Nein. Geht es dir heute Schlecht, weil dein Essen ausm Supermarkt kommt und du nicht selbst aufm Feld stehen musst? Vermutlich nicht...

Und sind wir mal ehrlich. Auf der einen Seite wird ständig was von Fachkräfte-Mangel gestöhnt. Auf der anderen Seite aber verschwenden wir doch gerade Fachkräfte z.B. darin, dass wir ihre Arbeitskraft in leicht automatisierbaren Berufen verschwenden, anstatt ihnen eine Wertvollere Tätigkeit zu geben. Wenn ich sehe, in wie vielen Firmen nach wie vor Große Flächen händisch mit Mob und Putzeimer gewischt werden bekomme ich Kopfschütteln. Da kann man doch nen Putzroboter rumfahren lassen - in einigen EDEKAs bei mir in der Region ist das mittlerweile der Fall. Davon werden die Putzfrauen aber nicht arbeitslos. Jeder der Lesen und Schreiben kann, kann sinnvoller, Wertschöpfender, eingesetzt werden.
 
  • Gefällt mir
Reaktionen: Solavidos
Da würde sich die Kanzlei Waldorf & Kollegen glatt wünschen ne US-Niederlassung zu haben. :daumen:
 
xerex.exe schrieb:
Falsch.

Die werden automatisiert gestriked, in den meisten Fällen aver nach Widerspruch anstandslos wiederhergestellt
Du solltest dir ganz schnell diese arrogante Faktenfinder-Attitude ala "Falsch." abgewöhnen. Es gibt genug Fälle bei denen nichts zurückgenommen wurde. Das sind keine Einzelfälle.
 
  • Gefällt mir
Reaktionen: tritratrullala, KarlsruheArgus und Cyberpunk61
Der digitale Slop-Fleischwolf muss sich ja irgendwie drehen
 
  • Gefällt mir
Reaktionen: iSight2TheBlind
Gutes Urteil!
Man sieht, wie eine neue Branche mit wachsender Lobby gegen die eingesessene Oldschool Lobby kämpft.
Es sollte letztlich darum gehen, was für die Allgemeinheit und nicht Unternehmen besser ist!
 
  • Gefällt mir
Reaktionen: NMA, 7hyrael und Kuristina
iSight2TheBlind schrieb:
@OrtusMalum Ein Modell wie bei der GEMA ist leider nicht wirklich umsetzbar, da beim Output aus AI niemand mehr sagen kann wo die Zutaten herkommen. Klar, wenn da "Nein, ich bin dein Vater!" steht kann man es sich schon denken wo zitiert wurde, aber nicht alles ist so eindeutig und das würde am Ende nur zu solchen Diskussionen wie beim Rechtstreit zwischen Kraftwerk und einem Produzenten, der ein extrem kurzes Sample aus einem Kraftwerk-Song verwendete, führen. Der Rechtstreit läuft seit über 25 Jahren und tappst regelmäßig mal beim BGH vorbei...
Eher braucht man da ein Modell wie bei der VG Wort, wo man im Grunde allleine schon weil man einen Text geschrieben und veröffentlicht hat bei den Ausschüttungen berücksichtigt werden kann.
(Die VG Wort bezieht das Geld welches sie ausschüttet dann aus Urheberrechtsabgaben auf Drucker usw. Da würden wir uns dann der bereits genannten Robotersteuer annähern, wenn man das aufgrund der Verbreitung von AI auf weite Felder anwendet


Ich werde mir hier jetzt nicht Anmaßen DIE Lösung für das Problem zu haben.
Aber zumindest bei Text-Bezügen wird die KI immer auch Zitate und Quellenangaben machen, um die eigene Glaubwürdigkeit und Überprüfbarkeit zu erhalten. Hier wäre dass dann recht einfach. Und jede KI die da umgehen will indem sie keine Zitate und Quellen mehr angibt, wird sich mangels Glaubwürdigkeit nicht halten, oder könnte rechtlich reguliert werden.

Man könnte auch eine "große" Gebühr am Anfang, wenn die Daten zu Trainingszwecken das erste mal genutzt werden machen. Die dann höher ausfällt als nur die paar Groschen. und sofern die KI-Betreiber einen Anspruch an Aktualität haben, werden die meisten wohl nicht die 20 Jahre abwarten. Sofern sich für beide Seite angemessene Preise finden lassen.

Aber wie gesagt. Ich maß mir nicht an, ein fertiges Konzept was alle Eventualitäten berücksichtigt anbieten zu können. Da gibt es Leute die von der relevanten Materie mehr Ahnung haben. Und da kann man sicher eine Lösung finden. Irgendjemand wird immer unzufrieden sein. Das ist sicher.
 
Zurück
Oben