Channels - Persona-Conditioned Adversarial Prompting: Multi-Identity Red-Teaming for Adversarial Discovery and Mitigation :: FRELIP Discovery

Similar Items: Persona-Conditioned Adversarial Prompting: Multi-Identity Red-Teaming for Adversarial Discovery and Mitigation

Quick Look
Autonomous Adversary: Red-Teaming in the age of LLM
Quick Look
Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning
Quick Look
Detecting Adversarial Data via Provable Adversarial Noise Amplification
Quick Look
FlashRT: Towards Computationally and Memory Efficient Red-Teaming for Prompt Injection and Knowledge Corruption
Quick Look
IPI-proxy: An Intercepting Proxy for Red-Teaming Web-Browsing AI Agents Against Indirect Prompt Injection
Quick Look
Low Rank Adaptation for Adversarial Perturbation
Quick Look
Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection
Quick Look
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack
Quick Look
Adversarial Update-Based Federated Unlearning for Poisoned Model Recovery
Quick Look
ContextualJailbreak: Evolutionary Red-Teaming via Simulated Conversational Priming
Quick Look
Redefining AI Red Teaming in the Agentic Era: From Weeks to Hours
Quick Look
Proteus: A Self-Evolving Red Team for Agent Skill Ecosystems
Quick Look
Understanding Adversarial Transferability in Vision-Language Models for Autonomous Driving: A Cross-Architecture Analysis
Quick Look
Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training
Quick Look
Repurposing Image Diffusion Models for Adversarial Synthetic Structured Data: A Case Study of Ground Truth Drift
Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
Tailored Prompts, Targeted Protection: Vulnerability-Specific LLM Analysis for Smart Contracts
Quick Look
PragLocker: Protecting Agent Intellectual Property in Untrusted Deployments via Non-Portable Prompts
Quick Look
Tracking Conversations: Measuring Content and Identity Exposure on AI Chatbots
Quick Look
InsureConnect: Blockchain and Digital Identity for the Property Insurance Market
Quick Look
AccLock: Unlocking Identity with Heartbeat Using In-Ear Accelerometers
Quick Look
Autonomous LLM Agent Worms: Cross-Platform Propagation, Automated Discovery and Temporal Re-Entry Defense
Quick Look
PersonaTeaming: Supporting Persona-Driven Red-Teaming for Generative AI
Quick Look
GLiGuard: Schema-Conditioned Classification for LLM Safeguard