Tag: Multi-Turn Attacks
Attacchi contro sistemi AI e Large Language Model che sfruttano conversazioni multi-turno per aggirare filtri di sicurezza, estrarre informazioni sensibili o manipolare il comportamento del modello. Tecniche che distribuiscono payload malevoli su più interazioni successive, eludendo controlli basati su singole richieste e sfruttando il contesto conversazionale per prompt injection indiretta, jailbreak progressivo o estrazione di dati riservati.
