Adversarial Attacks Articles

Page 1 of 1 (1 article)

10/25/2023 • EN

Adversarial Attacks on LLMs

Explores adversarial attacks and jailbreak prompts that can make large language models produce unsafe or undesired outputs, bypassing safety measures.

Adversarial Attacks Jailbreak Prompts large language models llm security

Lilian Weng

Adversarial Attacks Articles

Adversarial Attacks on LLMs

Select Language

We use cookies