Montag, November 25, 2024

Untersuchungen zeigen, dass KI-Modelle ihre Fähigkeiten beherrschen, lange bevor sie sie zur Schau stellen



Neue Forschungsergebnisse haben gezeigt, dass Modelle der künstlichen Intelligenz (KI) über einige Fähigkeiten verfügen, lange bevor sie diese im Training zeigen. Laut der von Havard und der University of Michigan durchgeführten Studie zeigen die Modelle diese Fähigkeiten erst dann, wenn sie es auf die eine oder andere Weise tun müssen.

Die Forschung ist eine von vielen, die durchgeführt wurden, um zu verstehen, wie KI-Modelle ihre Fähigkeiten aufbauen, bevor sie sie zur Schau stellen.

Die Studie analysierte, wie KI-Modelle grundlegende Konzepte wie Größe und Farbe erlernen, und zeigte, dass sie die Fähigkeiten früher beherrschen, als die meisten Tests vermuten lassen. Die Studie lieferte auch Einblicke in die Komplexität der Messung der Fähigkeiten einer KI. „Ein Modell könnte inkompetent erscheinen, wenn es Standardaufforderungen erhält, während es tatsächlich über hochentwickelte Fähigkeiten verfügt, die nur unter bestimmten Bedingungen zum Vorschein kommen“, heißt es in dem Artikel.

Untersuchungen zeigen, dass KI-Modelle Konzepte verinnerlichen

Havard und die University of Michigan sind nicht die ersten, die versuchen, die Fähigkeiten von KI-Modellen zu verstehen. Forscher von Anthropic stellen einen Artikel mit dem Titel „Dictionary Learning“ vor. In dem Artikel ging es um die Zuordnung von Verbindungen in ihrer Claude-Sprache zu spezifischen Konzepten, die sie versteht. Obwohl die meisten dieser Untersuchungen unterschiedliche Blickwinkel hatten, ging es in erster Linie darum, die KI-Modelle zu verstehen.

Anthropic enthüllte, dass es Merkmale gefunden hat, die mit verschiedenen interpretierbaren Konzepten verknüpft werden könnten. „Wir haben Millionen von Merkmalen gefunden, die interpretierbaren Konzepten zu entsprechen scheinen, die von konkreten Objekten wie Menschen, Ländern und berühmten Gebäuden bis hin zu abstrakten Ideen wie Emotionen, Schreibstilen und Argumentationsschritten reichen“, ergab die Untersuchung.

Während ihrer Forschung führten die Forscher mehrere Experimente mit dem Diffusionsmodell durch, einer der beliebtesten Architekturen für KI. Während des Experiments stellten sie fest, dass die Modelle über unterschiedliche Möglichkeiten zur Manipulation grundlegender Konzepte verfügten. Die Muster waren konsistent, da die KI-Modelle neue Fähigkeiten in verschiedenen Phasen und einen scharfen Übergangspunkt zeigten, der signalisierte, wann eine neue Fähigkeit erworben wurde.

Während des Trainings zeigten die Modelle, dass sie Konzepte rund 2.000 Schritte früher beherrschten, als ein Standardtest erkennen würde. Starke Konzepte tauchten bei etwa 6.000 Schritten auf und schwächere Konzepte waren bei etwa 20.000 Schritten sichtbar. Nachdem die Konzeptsignale angepasst wurden, entdeckten sie einen direkten Zusammenhang mit der Lerngeschwindigkeit.

Forscher enthüllen Methoden, um auf verborgene Fähigkeiten zuzugreifen

Die Forscher verwendeten alternative Eingabeaufforderungsmethoden, um verborgene Fähigkeiten aufzudecken, bevor sie in Standardtests gezeigt wurden. Die weit verbreitete Natur des versteckten Auftauchens hat Auswirkungen auf die KI-Bewertung und -Sicherheit. Beispielsweise können bei herkömmlichen Benchmarks bestimmte Fähigkeiten der KI-Modelle außer Acht gelassen werden, wodurch sowohl die nützlichen als auch die besorgniserregenden Aspekte außer Acht gelassen werden.

Während der Forschung fand das Team bestimmte Methoden heraus, um auf die verborgenen Fähigkeiten der KI-Modelle zuzugreifen. Die Forschung bezeichnete die Methoden als lineare latente Intervention und übermäßige Eingabeaufforderung, da die Forscher dafür sorgten, dass die Modelle komplexe Verhaltensweisen zeigten, bevor sie sich in Standardtests zeigten. Die Forscher entdeckten außerdem, dass die KI-Modelle bestimmte komplexe Funktionen manipulierten, bevor sie sie durch Standardaufforderungen anzeigen konnten.

Beispielsweise könnten Models aufgefordert werden, erfolgreich „lächelnde Frauen“ oder „Männer mit Hüten“ zu generieren, bevor sie aufgefordert werden, diese zu kombinieren. Untersuchungen haben jedoch gezeigt, dass sie gelernt haben, es früher zu kombinieren, es aber nicht durch herkömmliche Eingabeaufforderungen präsentieren können. Man kann sagen, dass es sich bei den Modellen, die Fähigkeiten zeigen, um Grokking handelt, eine Situation, in der Modelle nach längerem Training eine perfekte Testleistung zeigen. Die Forscher sagten jedoch, dass es wesentliche Unterschiede zwischen beiden gebe.

Während Grokking nach mehreren Trainingssitzungen stattfindet und die Verfeinerung mehrerer Verteilungen derselben Datensätze beinhaltet, zeigt die Forschung, dass diese Fähigkeiten während des aktiven Lernens entstehen. Die Forscher stellten fest, dass die Modelle neue Wege fanden, Konzepte durch phasenweise Veränderungen zu manipulieren, und nicht durch schrittweise Verbesserungen der Darstellung im Grokking.

Die Untersuchung zeigt, dass KI-Modelle diese Konzepte kennen, sie jedoch nicht in der Lage sind, sie darzustellen. Es ist vergleichbar mit Leuten, die einen ausländischen Film sehen und verstehen, aber die Sprache nicht sprechen können. Dies zeigt, dass die meisten Modelle mehr Fähigkeiten haben, als sie zeigen, und es zeigt auch, wie schwierig es ist, ihre Fähigkeiten zu verstehen und zu kontrollieren.

Ein Schritt-für-Schritt-System zum Start Ihrer Web3-Karriere und zur Erlangung hochbezahlter Krypto-Jobs in 90 Tagen.


Dieser Beitrag ist ein öffentlicher RSS Feed. Sie finden den Original Post unter folgender Quelle (Website) .

Unser Portal ist ein RSS-Nachrichtendienst und distanziert sich vor Falschmeldungen oder Irreführung. Unser Nachrichtenportal soll lediglich zum Informationsaustausch genutzt werden. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. Kryptohandel hat ein großes Handelsrisiko was zum Totalverlust führen kann.

Ähnliche Artikel

- Advertisement -spot_img

Letzten Artikel