Channels - Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis :: FRELIP Discovery

Similar Items: Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis

Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
Secret Stealing Attacks on Local LLM Fine-Tuning through Supply-Chain Model Code Backdoors
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios
Quick Look
Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection
Quick Look
Attention Is Where You Attack
Quick Look
Pop Quiz Attack: Black-box Membership Inference Attacks Against Large Language Models
Quick Look
Internet of Things Security: A Survey on Common Attacks
Quick Look
GPUBreach: Privilege Escalation Attacks on GPUs using Rowhammer
Quick Look
You Snooze, You Lose: Automatic Safety Alignment Restoration through Neural Weight Translation
Quick Look
SoK: Robustness in Large Language Models against Jailbreak Attacks
Quick Look
Autonomous Adversary: Red-Teaming in the age of LLM
Quick Look
Firmware Distribution as Attack Surface: A Security Study of ASIC Cryptocurrency Miners
Quick Look
Misrouter: Exploiting Routing Mechanisms for Input-Only Attacks on Mixture-of-Experts LLMs
Quick Look
When RAG Chatbots Expose Their Backend: An Anonymized Case Study of Privacy and Security Risks in Patient-Facing Medical AI
Quick Look
Noisy Networks, Nosy Neighbors: Simple Privacy Attacks Against Residential Wireless Traffic
Quick Look
FunFuzz: An LLM-Powered Evolutionary Fuzzing Framework
Quick Look
Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
Quick Look
GLiGuard: Schema-Conditioned Classification for LLM Safeguard
Quick Look
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack
Quick Look
Spying Across Chiplets: Side-Channel Attacks in 2.5/3D Integrated Systems
Quick Look
An Evaluation of Chat Safety Moderations in Roblox
Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code