Channels - StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction :: FRELIP Discovery

Similar Items: StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction

Quick Look
Reinforcement Learning for LLM-based Multi-Agent Systems through Orchestration Traces
Quick Look
OpenSeeker-v2: Pushing the Limits of Search Agents with Informative and High-Difficulty Trajectories
Quick Look
Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization
Quick Look
Trajectory as the Teacher: Few-Step Discrete Flow Matching via Energy-Navigated Distillation
Quick Look
SkillOS: Learning Skill Curation for Self-Evolving Agents
Quick Look
Agentic-imodels: Evolving agentic interpretability tools via autoresearch
Quick Look
Can Coding Agents Reproduce Findings in Computational Materials Science?
Quick Look
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling
Quick Look
STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
Quick Look
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems
Quick Look
FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
Quick Look
Cited but Not Verified: Parsing and Evaluating Source Attribution in LLM Deep Research Agents
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection
Quick Look
Stable Behavior, Limited Variation: Persona Validity in LLM Agents for Urban Sentiment Perception
Quick Look
Beating the Style Detector: Three Hours of Agentic Research on the AI-Text Arms Race
Quick Look
Self-Induced Outcome Potential: Turn-Level Credit Assignment for Agents without Verifiers
Quick Look
Ask Early, Ask Late, Ask Right: When Does Clarification Timing Matter for Long-Horizon Agents?
Quick Look
A11y-Compressor: A Framework for Enhancing the Efficiency of GUI Agent Observations through Visual Context Reconstruction and Redundancy Reduction
Quick Look
A Comparative Analysis of Classical Machine Learning and Deep Learning Approaches for Sentiment Classification on IMDb Movie Reviews
Quick Look
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training
Quick Look
Learning How and What to Memorize: Cognition-Inspired Two-Stage Optimization for Evolving Memory
Quick Look
MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning
Quick Look
Beyond Semantics: An Evidential Reasoning-Aware Multi-View Learning Framework for Trustworthy Mental Health Prediction
Quick Look
A Comprehensive Analysis of Tokenization and Self-Supervised Learning in End-to-End Automatic Speech Recognition applied on French Language