Große Technologieunternehmen, darunter OpenAI, Google, Meta und Anthropic, verlassen sich beim Training ihrer Large Language Models (LLMs) auf hochwertiges, urheberrechtlich geschütztes Material namhafter Verlage.
Dies geht aus einer Studie von Ziff Davis, der Muttergesellschaft von CNET, IGN und Mashable, hervor, die die wesentliche Rolle zeigt, die hochwertige Inhalte beim Training dieser KI-Modelle spielen. Die Studie zeigt, dass maßgebliche Quellen für Trainingsdatensätze in KI-Unternehmen bevorzugt werden, um die Leistung des Modells zu verbessern, der Beitrag dieser Quellen wird jedoch häufig vernachlässigt.
In der Untersuchung behaupteten der KI-Anwalt von Ziff Davis, George Wukoson, und der Chief Technology Officer Joey Fortuna, dass KI-Unternehmen Trainingsdaten auf der Grundlage des Rankings maßgeblicher Websites mit hohen Suchmaschinen-Rankings auswählen. Um die Modelle zu verbessern, wurden hochwertige und beliebte Websites ausgewählt, da diese einen guten Ruf genießen. Eine Strategie, die den KI-Entwicklern laut der Studie eine Feinabstimmung des Sprachmodells ermöglicht.
Ziff Davis hat darauf hingewiesen, dass erstklassige Content-Anbieter wie Axel Springer, Future PLC, Hearst, News Corp und The New York Times unter anderem zur Entwicklung von Trainingsdatensätzen beigetragen haben. Insbesondere wurde festgestellt, dass 12,04 % von OpenWebText2, das für die Erstellung von OpenAIs GPT-3 verwendet wurde, von diesen vertrauenswürdigen Herausgebern stammten.
Auch Mark Zuckerberg äußerte sich zur anhaltenden Debatte über den Einsatz von Inhalten im KI-Training. In einem kürzlichen Interview mit The Verge räumte Zuckerberg ein, dass das Daten-Scraping für KI eine Herausforderung darstellt, wies aber auch darauf hin, dass die Inhalte einzelner Ersteller oder Herausgeber möglicherweise nicht so wirkungsvoll sind. Er erklärte„Ich glaube, dass einzelne Ersteller oder Verleger dazu neigen, den Wert ihrer spezifischen Inhalte im Großen und Ganzen zu überschätzen.“
Verlage reichen Klagen gegen KI-Unternehmen ein
Die Geheimhaltung von Trainingsdatenquellen hat bei Verlegern und Verbrauchern gleichermaßen Bedenken hervorgerufen. Die New York Times und das Wall Street Journal haben kürzlich Klagen gegen KI-Unternehmen eingereicht und erklärt, dass diese durch die Nutzung ihrer Inhalte gegen Urheberrechte verstoßen hätten.
Während OpenAI seine Bemühungen vorangetrieben hat, Content-Lizenzen von Medienorganisationen wie der Financial Times und DotDash Meredith zu erhalten, arbeiten mehrere KI-Firmen immer noch ohne ordnungsgemäße Lizenzierung. Das heißt es im Bericht weiter „Große LLM-Entwickler geben ihre Trainingsdaten nicht mehr wie früher offen.“
Während die Werte von KI-Unternehmen steigen, bleibt die Kluft zwischen Technologie-Titanen und herkömmlichen Medienunternehmen groß. Tech-Giganten wie Google und Meta, die einen geschätzten Wert von 2,2 Billionen US-Dollar bzw. 1,5 Billionen US-Dollar haben, bleiben an der Spitze der generativen KI, während Start-ups wie OpenAI und Anthropic einen Wert von 157 Milliarden US-Dollar bzw. 40 Milliarden US-Dollar haben.
Andererseits sind Verlage immer noch mit Entlassungen und Umstrukturierungen konfrontiert, was ein Beweis für den finanziellen Druck ist, sich an ein zunehmend von KI geprägtes Umfeld anzupassen. Durch den Wettbewerb mit nutzergenerierten und KI-basierten Inhalten stehen zahlreiche Verlage vor Herausforderungen hinsichtlich der Kosten- und Personalreduzierung.
Dieser Beitrag ist ein öffentlicher RSS Feed. Sie finden den Original Post unter folgender Quelle (Website) .
Unser Portal ist ein RSS-Nachrichtendienst und distanziert sich vor Falschmeldungen oder Irreführung. Unser Nachrichtenportal soll lediglich zum Informationsaustausch genutzt werden. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. Kryptohandel hat ein großes Handelsrisiko was zum Totalverlust führen kann.