Glossaire
Jailbreak (contournement de garde-fous IA)
Technique visant à contourner les restrictions et les garde-fous d'un LLM pour lui faire produire du contenu interdit ou dangereux. Les jailbreaks exploitent des failles dans l'alignement du modèle via des prompts soigneusement construits. Pour les entreprises, un jailbreak réussi sur un chatbot peut exposer des données internes ou produire des réponses préjudiciables.