Wat is Prompt Injection

tl:dr: ”Prompt injection is een aanval waarbij kwaadaardige instructies in input of context worden verstopt om AI-gedrag te manipuleren.“

Wat is Prompt Injection?

Prompt injection is een beveiligingsrisico bij AI-systemen. Een aanvaller probeert via invoer of documenten verborgen instructies mee te geven, zodat het model ongewenst gedrag vertoont.

Denk aan het omzeilen van systeemregels, het lekken van gevoelige data of het forceren van ongewenste acties via toolgebruik.

Verdediging vraagt om meerdere lagen: inputsanitatie, strikte toolrechten, outputvalidatie en heldere guardrails.

Mogelijkheden of kansen voor
jouw organisatie bespreken?

Arjan Renkema Chris Hagg Damiaen Toussaint Arrow