Channels - Trajectory Supervision for Continual Tool-Use Learning in LLMs :: FRELIP Discovery

Similar Items: Trajectory Supervision for Continual Tool-Use Learning in LLMs

Quick Look
QKVShare: Quantized KV-Cache Handoff for Multi-Agent On-Device LLMs
Quick Look
Sustaining Cooperation in Populations Guided by AI: A Folk Theorem for LLMs
Quick Look
CalBench: Evaluating Coordination-Privacy Trade-offs in Multi-Agent LLMs
Quick Look
Continuous-time q-learning for mean-field control with common noise, part-II: q-learning algorithms
Quick Look
Beyond the Black Box: Interpretability of Agentic AI Tool Use
Quick Look
Continuous-time q-learning for mean-field control with common noise, part-I: Theoretical foundations
Quick Look
Switchcraft: AI Model Router for Agentic Tool Calling
Quick Look
Reinforced Agent: Inference-Time Feedback for Tool-Calling Agents
Quick Look
FitText: Evolving Agent Tool Ecologies via Memetic Retrieval
Quick Look
OrchJail: Jailbreaking Tool-Calling Text-to-Image Agents by Orchestration-Guided Fuzzing
Quick Look
ARMOR: An Agentic Framework for Reaction Feasibility Prediction via Adaptive Utility-aware Multi-tool Reasoning
Quick Look
Multi-Objective Constraint Inference using Inverse reinforcement learning
Quick Look
Decentralized Diffusion Policy Learning for Enhanced Exploration in Cooperative Multi-agent Reinforcement Learning
Quick Look
Cross-Modal Navigation with Multi-Agent Reinforcement Learning
Quick Look
Moira: Language-driven Hierarchical Reinforcement Learning for Pair Trading
Quick Look
Learning to Act and Cooperate for Distributed Black-Box Consensus Optimization
Quick Look
Hierarachical Multiagent Reinforcement Learning for Multi-Group Tax Game
Quick Look
Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning
Quick Look
Learning Material-Aware Hamiltonian Risk Fields for Safe Navigation
Quick Look
Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding
Quick Look
Nothing Deceives Like Success: Social Learning and the Illusion of Understanding in Science
Quick Look
Should I Replan? Learning to Spot the Right Time in Robust MAPF Execution
Quick Look
Quality-Aware Exploration Budget Allocation for Cooperative Multi-Agent Reinforcement Learning
Quick Look
Graph-SND: Sparse Aggregation for Behavioral Diversity in Multi-Agent Reinforcement Learning