Trusted Vibing

Armis-Studie zeigt Risiken hinter KI-generiertem Code

26.03.2026, Armis | Autor: Herbert Wieler

Cyber-Experten schlagen Alarm: KI-Modelle sind unsicherer als gedacht

Die rasante Entwicklung künstlicher Intelligenz sorgt nicht nur für Innovation, sondern auch für neue Gefahren. Armis, Spezialist für Cyber-Exposures und Sicherheitslösungen, warnt jetzt vor einem besorgniserregenden Trend: Die meisten führenden KI-Modelle produzieren unsicheren Code – und das in kritischen Anwendungsbereichen.

Untersuchungen zeigen, dass 100 % der führenden generativen KI-Modelle unsicheren Code für kritische Entwicklungsszenarien generieren

Der frisch veröffentlichte Trusted Vibing Benchmark Report von Armis Labs hat 18 Top-Modelle in 31 praxisnahen Szenarien getestet. Das Ergebnis: 100 Prozent der Modelle lieferten anfälligen Code.

Besonders kritisch: Schwachstellen tauchen in Hochrisikobereichen auf, etwa bei Speicherpufferüberläufen, dem Hochladen von Designdateien oder Authentifizierungssystemen. Die klare Empfehlung der Experten: Unternehmen müssen sofort KI-native Sicherheitskontrollen einführen, um teure Sicherheitslücken zu verhindern.

„Das Zeitalter des Vibe-Codings ist da – aber Geschwindigkeit darf nicht auf Kosten der Sicherheit gehen“, warnt Nadir Izrael, CTO und Mitgründer von Armis . „Die gefährlichsten Akteure sind oft genau jene, die Lösungen für die Probleme verkaufen, die ihre KI selbst verursacht. Wer weiterhin autonomen Code ohne Aufsicht einsetzt, riskiert nicht nur technische Schulden, sondern auch reale Schäden.“

Der Bericht zeichnet ein klares Bild der Sicherheitslage:

Allgemeine Schwachstellen: Selbst die modernsten KI-Modelle erzeugen in über 30 Prozent der Fälle unsicheren Code. Gleichzeitig zeigt der Armis Cyberwarfare Report 2026, dass 77 Prozent der IT-Entscheider weltweit auf die Sicherheit von Drittanbieter-Code vertrauen – obwohl 16 Prozent zugeben, nicht zu wissen, ob dieser gründlich geprüft wurde.
Qualitätsgefälle: Nicht alle KI-Modelle sind gleich. Während Gemini 3.1 Pro als führend gilt, weisen ältere proprietäre Modelle deutlich mehr Sicherheitslücken auf.
Kosten vs. Sicherheit: Teurer bedeutet nicht automatisch sicherer. Open-Source-Modelle wie Qwen 3.5 oder Minimax M2.5 liefern in Sachen Sicherheit oft Top-Leistung – zu einem Bruchteil der Kosten.

Nadir Izrael, CTO und Mitbegründer von Armis

Izrael bringt es auf den Punkt: „Unternehmen spielen aktuell ein riskantes Ratespiel mit KI-generiertem Code. Application Security muss sich von bloßem Scanner-Management zu echtem Risikomanagement entwickeln. Sicherheitsteams dürfen sich nicht in Signalen verlieren – KI-native Kontrollen, die Sicherheitslücken nach tatsächlichem Geschäftseinfluss priorisieren, sind der Schlüssel.“

Der Trusted Vibing Benchmark Report, regelmäßig von Armis Labs aktualisiert, bewertet, wie KI-Modelle sicheren Code generieren und kritische Schwachstellen vermeiden. Im Fokus stehen vier Bereiche: atomare Funktionstests, optimale Prompt-Auswahl, passende Testumgebungen und das richtige Application-Security-Tool. Die Botschaft ist klar: Wer bei KI-Coding auf Geschwindigkeit setzt, darf die Sicherheit nicht ignorieren. Unternehmen, die jetzt handeln, sichern nicht nur ihre Systeme – sondern auch ihre Zukunft.