Channels - SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies :: FRELIP Discovery

Similar Items: SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies

Quick Look
CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
Quick Look
CodeClinic: Evaluating Automation of Coding Skills for Clinical Reasoning Agents
Quick Look
Causal Foundations of Collective Agency
Quick Look
Retrieval-Conditioned Topology Selection with Provable Budget Conservation for Multi-Agent Code Generation
Quick Look
Emergent Communication for Co-constructed Emotion Between Embodied Agents via Collective Predictive Coding
Quick Look
Coopetition-Gym v1: A Formally Grounded Platform for Mixed-Motive Multi-Agent Reinforcement Learning under Strategic Coopetition
Quick Look
Bridging the Last Mile of Circuit Design: PostEDA-Bench, a Hierarchical Benchmark for PPA Convergence and DRC Fixing
Quick Look
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
Quick Look
AgenticPrecoding: LLM-Empowered Multi-Agent System for Precoding Optimization
Quick Look
Recursive Agent Optimization
Quick Look
LLM-enabled Social Agents
Quick Look
Conformal Agent Error Attribution
Quick Look
Social Theory Should Be a Structural Prior for Agentic AI: A Formal Framework for Multi-Agent Social Systems
Quick Look
Safe Multi-Agent Behavior Must Be Maintained, Not Merely Asserted: Constraint Drift in LLM-Based Multi-Agent Systems
Quick Look
Architectural Obsolescence of Unhardened Agentic-AI Runtimes
Quick Look
A Language for Describing Agentic LLM Contexts
Quick Look
AAFLOW: Scalable Patterns for Agentic AI Workflows
Quick Look
Many-to-Many Multi-Agent Pickup and Delivery
Quick Look
Agent Name Service (ANS): A Proof-of-Concept Trust Layer for Secure AI Agent Discovery, Identity, and Governance in Kubernetes
Quick Look
rAIson: Developing Reliable Decision-Making Agents
Quick Look
ARMATA: Auto-Regressive Multi-Agent Task Assignment
Quick Look
Cross-Modal Navigation with Multi-Agent Reinforcement Learning
Quick Look
Switchcraft: AI Model Router for Agentic Tool Calling
Quick Look
Conformity Generates Collective Misalignment in AI Agents Societies