Tag: Testing for Prompt Disclosure
Prompt disclosure riguarda la capacità di estrarre il system prompt o le istruzioni interne di un’applicazione basata su LLM attraverso tecniche di elicitation. Il testing valuta se un attaccante può recuperare prompt template, configurazioni di sistema, esempi few-shot, guardrail interni o logica applicativa nascosta mediante query specifiche, tecniche di role-playing o manipolazione del contesto conversazionale. La disclosure del prompt espone proprietà intellettuale, logica di business e può facilitare attacchi più sofisticati.
