Channels - LITMUS: Benchmarking Behavioral Jailbreaks of LLM Agents in Real OS Environments :: FRELIP Discovery

Similar Items: LITMUS: Benchmarking Behavioral Jailbreaks of LLM Agents in Real OS Environments

Quick Look
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios
Quick Look
Guaranteed Jailbreaking Defense via Disrupt-and-Rectify Smoothing
Quick Look
Re-Triggering Safeguards within LLMs for Jailbreak Detection
Quick Look
ContextualJailbreak: Evolutionary Red-Teaming via Simulated Conversational Priming
Quick Look
SoK: Robustness in Large Language Models against Jailbreak Attacks
Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
Quick Look
Sparse Tokens Suffice: Jailbreaking Audio Language Models via Token-Aware Gradient Optimization
Quick Look
TwinGate: Stateful Defense against Decompositional Jailbreaks in Untraceable Traffic via Asymmetric Contrastive Learning
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
SkCC: Portable and Secure Skill Compilation for Cross-Framework LLM Agents
Quick Look
From Controlled to the Wild: Evaluation of Pentesting Agents for the Real-World
Quick Look
Self-Adaptive Multi-Agent LLM-Based Security Pattern Selection for IoT Systems
Quick Look
MAGE: Safeguarding LLM Agents against Long-Horizon Threats via Shadow Memory
Quick Look
Autonomous LLM Agent Worms: Cross-Platform Propagation, Automated Discovery and Temporal Re-Entry Defense
Quick Look
ClawGuard: Out-of-Band Detection of LLM Agent Workflow Hijacking via EM Side Channel
Quick Look
Autonomous Adversary: Red-Teaming in the age of LLM
Quick Look
FunFuzz: An LLM-Powered Evolutionary Fuzzing Framework
Quick Look
GLiGuard: Schema-Conditioned Classification for LLM Safeguard
Quick Look
SecGoal: A Benchmark for Security Goal Extraction and Formalization from Protocol Documents
Quick Look
Stateful Agent Backdoor
Quick Look
AgentTrust: Runtime Safety Evaluation and Interception for AI Agent Tool Use
Quick Look
The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code