Channels - Autonomous Adversary: Red-Teaming in the age of LLM :: FRELIP Discovery

Similar Items: Autonomous Adversary: Red-Teaming in the age of LLM

Quick Look
ContextualJailbreak: Evolutionary Red-Teaming via Simulated Conversational Priming
Quick Look
Redefining AI Red Teaming in the Agentic Era: From Weeks to Hours
Quick Look
Understanding Adversarial Transferability in Vision-Language Models for Autonomous Driving: A Cross-Architecture Analysis
Quick Look
FlashRT: Towards Computationally and Memory Efficient Red-Teaming for Prompt Injection and Knowledge Corruption
Quick Look
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack
Quick Look
Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection
Quick Look
Autonomous LLM Agent Worms: Cross-Platform Propagation, Automated Discovery and Temporal Re-Entry Defense
Quick Look
Detecting Adversarial Data via Provable Adversarial Noise Amplification
Quick Look
Low Rank Adaptation for Adversarial Perturbation
Quick Look
Adversarial Update-Based Federated Unlearning for Poisoned Model Recovery
Quick Look
Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning
Quick Look
APIOT: Autonomous Vulnerability Management Across Bare-Metal Industrial OT Networks
Quick Look
Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training
Quick Look
FunFuzz: An LLM-Powered Evolutionary Fuzzing Framework
Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
Quick Look
GLiGuard: Schema-Conditioned Classification for LLM Safeguard
Quick Look
Repurposing Image Diffusion Models for Adversarial Synthetic Structured Data: A Case Study of Ground Truth Drift
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code
Quick Look
Security Attack and Defense Strategies for Autonomous Agent Frameworks: A Layered Review with OpenClaw as a Case Study
Quick Look
SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents
Quick Look
Tailored Prompts, Targeted Protection: Vulnerability-Specific LLM Analysis for Smart Contracts