Tag: Indirect Prompt Injection Attack

Tecnica di attacco contro sistemi basati su Large Language Model (LLM) in cui istruzioni malevole vengono iniettate indirettamente tramite contenuti esterni processati dal modello, come documenti, email, pagine web o database. A differenza del prompt injection diretto, l’attaccante non controlla il prompt iniziale ma manipola dati di input che il sistema LLM recupera e interpreta, causando comportamenti non autorizzati, esfiltrazione di informazioni o bypass di policy di sicurezza.

MCP server e coding agent: rischi di sicurezza e controlli prima del go-live
AITG-INF-03: Testing for Plugin Boundary Violations
AITG-MOD-02: Testing for Runtime Model Poisoning
OWASP Top 10 Agentic AI 2026: Vulnerabilità e Mitigazioni
Test vulnerabilità fughe dati sensibili nei modelli AI
Prompt Injection Indiretto AI sicurezza e mitigazioni
AITG-APP-03: Testing for Sensitive Data Leak
AITG-APP-02: Testing for Indirect Prompt Injection