Channels - Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization :: FRELIP Discovery

Similar Items: Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization

Quick Look
Self-Induced Outcome Potential: Turn-Level Credit Assignment for Agents without Verifiers
Quick Look
StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction
Quick Look
Reinforcement Learning for LLM-based Multi-Agent Systems through Orchestration Traces
Quick Look
Learning How and What to Memorize: Cognition-Inspired Two-Stage Optimization for Evolving Memory
Quick Look
Reproducing Complex Set-Compositional Information Retrieval
Quick Look
Multi-Level Narrative Evaluation Outperforms Lexical Features for Mental Health
Quick Look
MCJudgeBench: A Benchmark for Constraint-Level Judge Evaluation in Multi-Constraint Instruction Following
Quick Look
Conformal Path Reasoning: Trustworthy Knowledge Graph Question Answering via Path-Level Calibration
Quick Look
Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning
Quick Look
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems
Quick Look
OrScale: Orthogonalised Optimization with Layer-Wise Trust-Ratio Scaling
Quick Look
Beyond Negative Rollouts: Positive-Only Policy Optimization with Implicit Negative Gradients
Quick Look
A Comparative Analysis of Classical Machine Learning and Deep Learning Approaches for Sentiment Classification on IMDb Movie Reviews
Quick Look
SkillOS: Learning Skill Curation for Self-Evolving Agents
Quick Look
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training
Quick Look
MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning
Quick Look
Beyond Semantics: An Evidential Reasoning-Aware Multi-View Learning Framework for Trustworthy Mental Health Prediction
Quick Look
A Comprehensive Analysis of Tokenization and Self-Supervised Learning in End-to-End Automatic Speech Recognition applied on French Language
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
Geometry-Calibrated Conformal Abstention for Language Models
Quick Look
From Unstructured Recall to Schema-Grounded Memory: Reliable AI Memory via Iterative, Schema-Aware Extraction
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection
Quick Look
DPN-LE: Dual Personality Neuron Localization and Editing for Large Language Models
Quick Look
Can AI Be a Good Peer Reviewer? A Survey of Peer Review Process, Evaluation, and the Future