Channels - Safety Context Injection: Inference-Time Safety Alignment via Static Filtering and Agentic Analysis :: FRELIP Discovery

Similar Items: Safety Context Injection: Inference-Time Safety Alignment via Static Filtering and Agentic Analysis

Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
AgentTrust: Runtime Safety Evaluation and Interception for AI Agent Tool Use
Quick Look
You Snooze, You Lose: Automatic Safety Alignment Restoration through Neural Weight Translation
Quick Look
Safety Anchor: Defending Harmful Fine-tuning via Geometric Bottlenecks
Quick Look
No More, No Less: Task Alignment in Terminal Agents
Quick Look
Model-Agnostic Lifelong LLM Safety via Externalized Attack-Defense Co-Evolution
Quick Look
AutoSOUP: Safety-Oriented Unit Proof Generation for Component-level Memory-Safety Verification
Quick Look
An Evaluation of Chat Safety Moderations in Roblox
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
PoisonCap: Efficient Hierarchical Temporal Safety for CHERI
Quick Look
SCRIBE: Practical Static Binary Patching via Binary-Aware Recompilation of Decompiled Code
Quick Look
Sleeper Channels and Provenance Gates: Persistent Prompt Injection in Always-on Autonomous AI Agents
Quick Look
Exposing LLM Safety Gaps Through Mathematical Encoding:New Attacks and Systematic Analysis
Quick Look
Phantom Force: Injecting Adversarial Tactile Perceptions into Embodied Intelligence via EMI
Quick Look
Gaming the Metric, Not the Harm: Certifying Safety Audits against Strategic Platform Manipulation
Quick Look
Generate "Normal", Edit Poisoned: Branding Injection via Hint Embedding in Image Editing
Quick Look
IPI-proxy: An Intercepting Proxy for Red-Teaming Web-Browsing AI Agents Against Indirect Prompt Injection
Quick Look
ML-Bench&Guard: Policy-Grounded Multilingual Safety Benchmark and Guardrail for Large Language Models
Quick Look
Static Attribution of Android Residential Proxy Malware Using Graph Kernels
Quick Look
Semia: Auditing Agent Skills via Constraint-Guided Representation Synthesis
Quick Look
MAGE: Safeguarding LLM Agents against Long-Horizon Threats via Shadow Memory
Quick Look
Security Analysis of Time-of-Arrival Estimation via Cross-Correlation under Narrow-Band Conditions
Quick Look
PragLocker: Protecting Agent Intellectual Property in Untrusted Deployments via Non-Portable Prompts
Quick Look
ClawGuard: Out-of-Band Detection of LLM Agent Workflow Hijacking via EM Side Channel