KI-Agenten

Autonome KI als neue Angriffsfläche in der IT-Sicherheit

18.02.2026, JFrog | Autor: Herbert Wieler

Vom Werkzeug zur Waffe: Wie KI-Agenten die Bedrohungslage 2026 verändern

Einordnung von Shachar Menashe, VP Security Research bei JFrog

Noch vor wenigen Jahren galten KI-Systeme in der IT-Sicherheit vor allem als hilfreiche Werkzeuge: Sie analysierten Logs, fanden bekannte Schwachstellen und beschleunigten Entwicklungsprozesse. Doch dieses Bild beginnt zu kippen. Mit dem Aufkommen autonomer KI-Agenten verschiebt sich die Bedrohungslage spürbar – weg von klassischen Anwendungen, hin zu der Infrastruktur, auf der KI selbst arbeitet.

Shachar Menashe, VP Security Research bei Jfrog

Was bislang als technische Spielwiese für Innovation galt, entwickelt sich 2026 zu einer neuen, hochattraktiven Angriffsfläche.

Autonome KI-Agenten treffen Entscheidungen, greifen auf externe Quellen zu und führen teilweise eigenständig Code aus. Genau darin liegt ihre Stärke – und ihre Schwäche. Angreifer werden diese Dynamik gezielt ausnutzen. Ein besonders sensibles Beispiel sind sogenannte MCP-Server (Model Context Protocol). Sie fungieren als Bindeglied zwischen Agenten, Tools und Kontextdaten. Vergleichbar mit Paket-Ökosystemen wie npm oder PyPI waren sie lange kaum im Fokus von Angreifern – und sind gerade deshalb attraktiv. Eine einzige kompromittierte Komponente kann ausreichen, um eine ganze Agenten-Kette zu manipulieren.

Prompt-Injection: Vom hilfreichen Input zur vollständigen Kompromittierung

Besonders kritisch wird es dort, wo Agenten Eingaben aus externen oder unbeaufsichtigten Quellen übernehmen. Prompt-Injection-Angriffe können Agenten dazu bringen, Dinge zu tun, die sie eigentlich niemals dürften: Sicherheitsmechanismen umgehen, Code ausführen oder vertrauliche Daten preisgeben.

Das realistische Szenario für 2026: Ein bösartiger Prompt taucht auf einer öffentlich zugänglichen Website auf. Ein KI-Agent liest ihn, interpretiert ihn als legitimen Kontext – und löst damit ungewollt eine Remote-Code-Ausführung aus. Die Sandbox wird umgangen, die Entwicklerumgebung kompromittiert. Nicht durch klassische Malware, sondern durch „missverstandene“ Sprache.

Selbstverbreitende Angriffe im KI-Zeitalter

Parallel dazu beobachten Sicherheitsforscher einen Anstieg sogenannter „wormable“ Pakete. Schadsoftware wie Shai Hulud oder GlassWorm nutzt gefundene Zugangsdaten, um sich automatisch weiterzuverbreiten. Kombiniert mit KI-Agenten, die eigenständig Systeme scannen oder Abhängigkeiten laden, entsteht ein brandgefährlicher Multiplikator. Hier zeigt sich: KI beschleunigt nicht nur Verteidigung – sondern auch Angriff.

Vibe Coding: Wenn Geschwindigkeit zur Sicherheitsschuld wird

Ein weiterer Trend verschärft die Lage: „Vibe Coding“. Statt Code selbst zu schreiben, lassen Entwickler KI große Teile automatisch generieren. Das spart Zeit, kostet aber Qualität.

Repositorys füllen sich mit funktionierendem, aber schlecht verstandenem Code. Versteckte Logikfehler, unsaubere Abhängigkeiten und schwer erkennbare Schwachstellen sind die Folge. KI-Tools erkennen zwar offensichtliche Probleme zuverlässig, scheitern jedoch an komplexen Zusammenhängen.

Ein Beispiel aus der Praxis: Bei der Schwachstelle React2Shell dauerte es rund 30 Stunden, bis ein funktionierender Proof of Concept gefunden wurde – trotz massiver KI-Unterstützung und hoher Aktivität auf Plattformen wie HackerOne. Ohne menschliche Expertise kam die Analyse nicht voran.

Die Rückkehr der menschlichen Sicherheitsforschung

All das führt zu einer klaren Erkenntnis: KI ersetzt keine Sicherheitsforscher. Sie verändert ihre Rolle. 2026 wird Threat Hunting zweigleisig ablaufen:

KI übernimmt das Durchsuchen großer Datenmengen und das Erkennen bekannter Muster.
Menschen konzentrieren sich auf die „tiefen Fehler“ – komplexe Logikprobleme, Architekturfragen und kreative Angriffspfade. Führungskräfte stehen hier besonders in der Verantwortung. Geschwindigkeit darf nicht wichtiger werden als Sorgfalt. Strengere Code-Reviews, klare Sicherheitsprozesse und bewusst eingeplante menschliche Kontrolle sind kein Rückschritt, sondern eine notwendige Korrektur.

Zero Trust – auch (und gerade) für KI

Die vielleicht wichtigste Lehre: KI-Agenten dürfen nicht mehr als vertrauenswürdige Werkzeuge betrachtet werden. Sie sind potenziell kompromittierbare Akteure im eigenen System.

Das bedeutet konkret:

strikte Containerisierung,
starke Isolation durch Micro-VM-Architekturen,
Zero-Trust-Prinzipien auch innerhalb der KI-Infrastruktur. Sicherheitsverletzungen werden sich nicht vollständig verhindern lassen. Entscheidend ist, ihre Ausbreitung zu begrenzen.

Fazit: Sicherheit neu denken

2026 markiert einen Wendepunkt. KI ist nicht mehr nur Hilfsmittel, sondern Teil der Angriffsfläche. Autonome Agenten, dynamische Infrastrukturen und beschleunigte Entwicklung verändern die Spielregeln grundlegend. Die Antwort darauf ist kein Verzicht auf KI – sondern ein reiferer Umgang mit ihr. Wer KI mit menschlicher Expertise kombiniert, Geschwindigkeit mit Strenge ausbalanciert und Zero Trust konsequent umsetzt, kann die Vorteile nutzen, ohne die Kontrolle zu verlieren.

jailbreak-prompts

jfrog

ki-agenten

künstliche intelligenz (ki)

prompt injection