Channels - Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key :: FRELIP Discovery

Similar Items: Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key

Quick Look
WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation
Quick Look
Ask Early, Ask Late, Ask Right: When Does Clarification Timing Matter for Long-Horizon Agents?
Quick Look
LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling
Quick Look
Misaligned by Reward: Socially Undesirable Preferences in LLMs
Quick Look
Beyond Benchmarks: MathArena as an Evaluation Platform for Mathematics with LLMs
Quick Look
Beyond Confidence: Rethinking Self-Assessments for Performance Prediction in LLMs
Quick Look
SERE: Structural Example Retrieval for Enhancing LLMs in Event Causality Identification
Quick Look
mdok-style at SemEval-2026 Task 10: Finetuning LLMs for Conspiracy Detection
Quick Look
mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection
Quick Look
When LLMs Stop Following Steps: A Diagnostic Study of Procedural Execution in Language Models
Quick Look
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement
Quick Look
Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs
Quick Look
Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning
Quick Look
Correct Is Not Enough: Training Reasoning Planners with Executor-Grounded Rewards
Quick Look
Shadow-Loom: Causal Reasoning over Graphical World Model of Narratives
Quick Look
Automated Clinical Report Generation for Remote Cognitive Remediation: Comparing Knowledge-Engineered Templates and LLMs in Low-Resource Settings
Quick Look
The Impossibility Triangle of Long-Context Modeling
Quick Look
GazeVLM: Active Vision via Internal Attention Control for Multimodal Reasoning
Quick Look
Reasoning Is Not Free: Robust Adaptive Cost-Efficient Routing for LLM-as-a-Judge
Quick Look
Rebellious Student: Reversing Teacher Signals for Reasoning Exploration with Self-Distilled RLVR
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
Long Context Pre-Training with Lighthouse Attention
Quick Look
Characterizing the Expressivity of Local Attention in Transformers
Quick Look
Accurate Legal Reasoning at Scale: Neuro-Symbolic Offloading and Structural Auditability for Robust Legal Adjudication