Channels - MOSAIC-Bench: Measuring Compositional Vulnerability Induction in Coding Agents :: FRELIP Discovery

Similar Items: MOSAIC-Bench: Measuring Compositional Vulnerability Induction in Coding Agents

Quick Look
CyBiasBench: Benchmarking Bias in LLM Agents for Cyber-Attack Scenarios
Quick Look
Agentic Vulnerability Reasoning on Windows COM Binaries
Quick Look
How Code Representation Shapes False-Positive Dynamics in Cross-Language LLM Vulnerability Detection
Quick Look
Patch2Vuln: Agentic Reconstruction of Vulnerabilities from Linux Distribution Binary Patches
Quick Look
The Infinite Mutation Engine? Measuring Polymorphism in LLM-Generated Offensive Code
Quick Look
ML-Bench&Guard: Policy-Grounded Multilingual Safety Benchmark and Guardrail for Large Language Models
Quick Look
Generating Proof-of-Vulnerability Tests to Help Enhance the Security of Complex Software
Quick Look
APIOT: Autonomous Vulnerability Management Across Bare-Metal Industrial OT Networks
Quick Look
KingsGuard: Enclave Data Protection Under Real-World TEE Vulnerabilities
Quick Look
Tailored Prompts, Targeted Protection: Vulnerability-Specific LLM Analysis for Smart Contracts
Quick Look
Stateful Agent Backdoor
Quick Look
AgentTrust: Runtime Safety Evaluation and Interception for AI Agent Tool Use
Quick Look
KVerus: Scalable and Resilient Formal Verification Proof Generation for Rust Code
Quick Look
Longitudinal Analyses of SAST Tools: A CodeQL Case Study
Quick Look
LoopTrap: Termination Poisoning Attacks on LLM Agents
Quick Look
Profiling for Pennies: Unveiling the Privacy Iceberg of LLM Agents
Quick Look
SCRIBE: Practical Static Binary Patching via Binary-Aware Recompilation of Decompiled Code
Quick Look
Can I Check What I Designed? Mapping Security Design DSLs to Code Analyzers
Quick Look
Tracking Conversations: Measuring Content and Identity Exposure on AI Chatbots
Quick Look
When Alignment Isn't Enough: Response-Path Attacks on LLM Agents
Quick Look
Semia: Auditing Agent Skills via Constraint-Guided Representation Synthesis
Quick Look
ARGUS: Defending LLM Agents Against Context-Aware Prompt Injection
Quick Look
Redefining AI Red Teaming in the Agentic Era: From Weeks to Hours
Quick Look
Secret Stealing Attacks on Local LLM Fine-Tuning through Supply-Chain Model Code Backdoors