Channels - Misrouter: Exploiting Routing Mechanisms for Input-Only Attacks on Mixture-of-Experts LLMs :: FRELIP Discovery

Similar Items: Misrouter: Exploiting Routing Mechanisms for Input-Only Attacks on Mixture-of-Experts LLMs

Quick Look
MASCing: Configurable Mixture-of-Experts Behavior via Activation Steering Masks
Quick Look
On the Privacy of LLMs: An Ablation Study
Quick Look
Attention Is Where You Attack
Quick Look
Pop Quiz Attack: Black-box Membership Inference Attacks Against Large Language Models
Quick Look
GESR: Graph-Based Edge Semantic Reconstruction for Stealthy Communication Detection with Benign-Only Training
Quick Look
Trident: Improving Malware Detection with LLMs and Behavioral Features
Quick Look
Internet of Things Security: A Survey on Common Attacks
Quick Look
GPUBreach: Privilege Escalation Attacks on GPUs using Rowhammer
Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
EvoPoC: Automated Exploit Synthesis for DeFi Smart Contracts via Hierarchical Knowledge Graphs
Quick Look
Graph Representation Learning Augmented Model Manipulation on Federated Fine-Tuning of LLMs
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
SoK: Robustness in Large Language Models against Jailbreak Attacks
Quick Look
Firmware Distribution as Attack Surface: A Security Study of ASIC Cryptocurrency Miners
Quick Look
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios
Quick Look
REBENCH: A Procedural, Fair-by-Construction Benchmark for LLMs on Stripped-Binary Types and Names (Extended Version)
Quick Look
Latent Adversarial Detection: Adaptive Probing of LLM Activations for Multi-Turn Attack Detection
Quick Look
Noisy Networks, Nosy Neighbors: Simple Privacy Attacks Against Residential Wireless Traffic
Quick Look
Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis
Quick Look
STARE: Step-wise Temporal Alignment and Red-teaming Engine for Multi-modal Toxicity Attack
Quick Look
Spying Across Chiplets: Side-Channel Attacks in 2.5/3D Integrated Systems
Quick Look
Secret Stealing Attacks on Local LLM Fine-Tuning through Supply-Chain Model Code Backdoors
Quick Look
Security Attack and Defense Strategies for Autonomous Agent Frameworks: A Layered Review with OpenClaw as a Case Study
Quick Look
Privacy by Postprocessing the Discrete Laplace Mechanism