Channels - Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection :: FRELIP Discovery

Similar Items: Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection

Quick Look
Detecting Adversarial Data via Provable Adversarial Noise Amplification
Quick Look
Autonomous Adversary: Red-Teaming in the age of LLM
Quick Look
Backdoor Mitigation in Object Detection via Adversarial Fine-Tuning
Quick Look
Low Rank Adaptation for Adversarial Perturbation
Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
Fight Poison with Poison: Enhancing Robustness in Few-shot Machine-Generated Text Detection with Adversarial Training
Quick Look
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios
Quick Look
Self-Adaptive Multi-Agent LLM-Based Security Pattern Selection for IoT Systems
Quick Look
Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis
Quick Look
Heimdallr: Characterizing and Detecting LLM-Induced Security Risks in GitHub CI Workflows
Quick Look
How Code Representation Shapes False-Positive Dynamics in Cross-Language LLM Vulnerability Detection
Quick Look
Secret Stealing Attacks on Local LLM Fine-Tuning through Supply-Chain Model Code Backdoors
Quick Look
ClawGuard: Out-of-Band Detection of LLM Agent Workflow Hijacking via EM Side Channel
Quick Look
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack
Quick Look
Attention Is Where You Attack
Quick Look
Pop Quiz Attack: Black-box Membership Inference Attacks Against Large Language Models
Quick Look
Adversarial Update-Based Federated Unlearning for Poisoned Model Recovery
Quick Look
Internet of Things Security: A Survey on Common Attacks
Quick Look
GPUBreach: Privilege Escalation Attacks on GPUs using Rowhammer
Quick Look
Evaluating Tabular Representation Learning for Network Intrusion Detection
Quick Look
Trident: Improving Malware Detection with LLMs and Behavioral Features
Quick Look
Re-Triggering Safeguards within LLMs for Jailbreak Detection
Quick Look
GuardSec: A Multi-Modal Web Platform for Real-Time Digital Fraud Detection, Entity Verification, and Connection Security Analysis in the African Context