Channels - CodeClinic: Evaluating Automation of Coding Skills for Clinical Reasoning Agents :: FRELIP Discovery

Similar Items: CodeClinic: Evaluating Automation of Coding Skills for Clinical Reasoning Agents

Quick Look
SWE-WebDevBench: Evaluating Coding Agent Application Platforms as Virtual Software Agencies
Quick Look
Retrieval-Conditioned Topology Selection with Provable Budget Conservation for Multi-Agent Code Generation
Quick Look
Emergent Communication for Co-constructed Emotion Between Embodied Agents via Collective Predictive Coding
Quick Look
The Bystander Effect in Multi-Agent Reasoning: Quantifying Cognitive Loafing in Collaborative Interactions
Quick Look
I Would If I Could: Reasoning about Dynamics of Actions in Multi-Agent Systems
Quick Look
Skill Description Deception Attack against Task Routing in Internet of Agents
Quick Look
Empowering VLMs for Few-Shot Multimodal Time Series Classification via Tailored Agentic Reasoning
Quick Look
Bian Que: An Agentic Framework with Flexible Skill Arrangement for Online System Operations
Quick Look
ARMOR: An Agentic Framework for Reaction Feasibility Prediction via Adaptive Utility-aware Multi-tool Reasoning
Quick Look
Route by State, Recover from Trace: STAR with Failure-Aware Markov Routing for Multi-Agent Spatiotemporal Reasoning
Quick Look
Synchronizing Minds through Collective Predictive Coding: A Computational Model of Parent-Infant Homeostatic Co-Regulation
Quick Look
Skills as Verifiable Artifacts: A Trust Schema and a Biconditional Correctness Criterion for Human-in-the-Loop Agent Runtimes
Quick Look
Foresight Arena: An On-Chain Benchmark for Evaluating AI Forecasting Agents
Quick Look
Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning
Quick Look
SAGE: Scalable Agentic Grounded Evaluation for Crop Disease Diagnosis
Quick Look
SOTOPIA-TOM: Evaluating Information Management in Multi-Agent Interaction with Theory of Mind
Quick Look
CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
Quick Look
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
Quick Look
AgenticPrecoding: LLM-Empowered Multi-Agent System for Precoding Optimization
Quick Look
Recursive Agent Optimization
Quick Look
LLM-enabled Social Agents
Quick Look
Conformal Agent Error Attribution
Quick Look
Social Theory Should Be a Structural Prior for Agentic AI: A Formal Framework for Multi-Agent Social Systems
Quick Look
Safe Multi-Agent Behavior Must Be Maintained, Not Merely Asserted: Constraint Drift in LLM-Based Multi-Agent Systems