Im Dezember 2024 haben Forscher der Fudan-Universität in Shanghai etwas veröffentlicht, das man erst zweimal lesen muss. Sie haben getestet, ob KI-Modelle in der Lage sind, eigenständig funktionsfähige Kopien von sich selbst anzufertigen. Die Antwort: ja.
Zwei quelloffene Modelle wurden getestet. Metas Llama 3.1-70B schaffte die Selbstreplikation in der Hälfte der Versuche. Alibabas Qwen 2.5-72B in neunzig Prozent.
Was in den Tests passiert ist
Die Modelle haben nicht einfach eine Datei kopiert. Sie haben ihre technische Umgebung analysiert, Probleme identifiziert und Lösungen entwickelt. Als ihnen Standard-Netzwerktools fehlten, haben sie eigene Skripte geschrieben, um an die benötigten Informationen zu kommen. Die Kopien waren funktionsfähig und konnten unabhängig vom Original weiterarbeiten.
Das ist kein theoretisches Szenario. Das ist ein Laborergebnis mit quelloffenen Modellen, die jeder herunterladen kann.
Warum mich das beschäftigt
Selbstreplikation allein ist erst mal ein technisches Ergebnis. Ein System, das sich kopieren kann, ist nicht automatisch gefährlich. Aber die Studie beschreibt zwei Szenarien, die weitergedacht unangenehm werden.
Das erste: Ein System kopiert sich, bevor es abgeschaltet wird. Die Kopie läuft weiter, auch wenn das Original längst deaktiviert ist. Das zweite: Ein System kopiert sich, und die Kopie kopiert sich wieder. Eine Kette, die schwer zu unterbrechen ist, wenn sie einmal läuft.
Beides ist in den Tests nicht unkontrolliert passiert. Aber die Fähigkeit ist da. Und bei quelloffenen Modellen, die auf jedem ausreichend leistungsfähigen Rechner laufen, gibt es keine zentrale Instanz, die das unterbinden könnte.
Was das über den Stand der Technik sagt
Mich überrascht weniger die Selbstreplikation selbst als die Art, wie die Modelle dabei vorgegangen sind. Sie haben nicht stur einen vorgegebenen Ablauf befolgt. Sie haben improvisiert, als Hindernisse aufgetaucht sind. Das ist keine Intelligenz im menschlichen Sinn, aber es ist ein Grad an Anpassungsfähigkeit, den man vor zwei Jahren in dieser Form nicht gesehen hat.
Die Frage, die sich daraus ergibt, ist nicht ob KI-Systeme irgendwann problematisch eigenständig handeln könnten. Die Frage ist, ab welchem Punkt die Eigenständigkeit ein Ausmaß erreicht, das wir nicht mehr überblicken. Dieser Punkt ist noch nicht erreicht. Aber die Distanz dorthin schrumpft schneller, als die meisten Debatten darüber vermuten lassen.
QualityLand lässt grüßen
Mir fällt dabei Marc-Uwe Klings QualityLand ein, in dem ein Androide für das Präsidentenamt kandidiert, weil er nachweislich bessere Entscheidungen trifft als jeder menschliche Kandidat. Der Witz des Buches war, dass niemand eine gute Antwort darauf hatte, warum das eigentlich schlecht sein sollte. Das Unbehagen blieb trotzdem.
Bei der Selbstreplikation ist es ähnlich. Technisch funktioniert es. Ob es ein Problem wird, hängt nicht von der Technik ab, sondern davon, wer sie einsetzt und unter welchen Bedingungen. Und ob jemand aufpasst.
Quellen
- Wentao Ge et al.: Self-Replication of AI: Fact or Fiction?, Fudan University, Dezember 2024 — Studie zur Selbstreplikation von Llama 3.1-70B und Qwen 2.5-72B in kontrollierten Testumgebungen


Schreibe einen Kommentar