Channels - SkillSafetyBench: Evaluating Agent Safety under Skill-Facing Attack Surfaces :: FRELIP Discovery

Similar Items: SkillSafetyBench: Evaluating Agent Safety under Skill-Facing Attack Surfaces

Quick Look
Skill Description Deception Attack against Task Routing in Internet of Agents
Quick Look
CodeClinic: Evaluating Automation of Coding Skills for Clinical Reasoning Agents
Quick Look
SkillOps: Managing LLM Agent Skill Libraries as Self-Maintaining Software Ecosystems
Quick Look
CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
Quick Look
Attacks and Mitigations for Distributed Governance of Agentic AI under Byzantine Adversaries
Quick Look
Bian Que: An Agentic Framework with Flexible Skill Arrangement for Online System Operations
Quick Look
SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies
Quick Look
When Embedding-Based Defenses Fail: Rethinking Safety in LLM-Based Multi-Agent Systems
Quick Look
Skills as Verifiable Artifacts: A Trust Schema and a Biconditional Correctness Criterion for Human-in-the-Loop Agent Runtimes
Quick Look
Finding the Weakest Link: Adversarial Attack against Multi-Agent Communications
Quick Look
Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital
Quick Look
Foresight Arena: An On-Chain Benchmark for Evaluating AI Forecasting Agents
Quick Look
Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning
Quick Look
SAGE: Scalable Agentic Grounded Evaluation for Crop Disease Diagnosis
Quick Look
Bridging the Last Mile of Circuit Design: PostEDA-Bench, a Hierarchical Benchmark for PPA Convergence and DRC Fixing
Quick Look
SOTOPIA-TOM: Evaluating Information Management in Multi-Agent Interaction with Theory of Mind
Quick Look
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
Quick Look
AgenticPrecoding: LLM-Empowered Multi-Agent System for Precoding Optimization
Quick Look
Coopetition-Gym v1: A Formally Grounded Platform for Mixed-Motive Multi-Agent Reinforcement Learning under Strategic Coopetition
Quick Look
Recursive Agent Optimization
Quick Look
Digital Identity for Agentic Systems: Toward a Portable Authorization Standard for Autonomous Agents
Quick Look
AgentDisCo: Towards Disentanglement and Collaboration in Open-ended Deep Research Agents
Quick Look
SHM-Agents: A Generalist-Specialist Integrated Agent System for Structural Health Monitoring
Quick Look
LLM-enabled Social Agents