Channels - LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling :: FRELIP Discovery

Similar Items: LLMs Improving LLMs: Agentic Discovery for Test-Time Scaling

Quick Look
Misaligned by Reward: Socially Undesirable Preferences in LLMs
Quick Look
Beyond Benchmarks: MathArena as an Evaluation Platform for Mathematics with LLMs
Quick Look
Beyond Confidence: Rethinking Self-Assessments for Performance Prediction in LLMs
Quick Look
SERE: Structural Example Retrieval for Enhancing LLMs in Event Causality Identification
Quick Look
Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key
Quick Look
mdok-style at SemEval-2026 Task 10: Finetuning LLMs for Conspiracy Detection
Quick Look
mdok-style at SemEval-2026 Task 9: Finetuning LLMs for Multilingual Polarization Detection
Quick Look
When LLMs Stop Following Steps: A Diagnostic Study of Procedural Execution in Language Models
Quick Look
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement
Quick Look
Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs
Quick Look
Automated Clinical Report Generation for Remote Cognitive Remediation: Comparing Knowledge-Engineered Templates and LLMs in Low-Resource Settings
Quick Look
Ask Early, Ask Late, Ask Right: When Does Clarification Timing Matter for Long-Horizon Agents?
Quick Look
Agentic-imodels: Evolving agentic interpretability tools via autoresearch
Quick Look
OrScale: Orthogonalised Optimization with Layer-Wise Trust-Ratio Scaling
Quick Look
Accurate and Efficient Statistical Testing for Word Semantic Breadth
Quick Look
Can Coding Agents Reproduce Findings in Computational Materials Science?
Quick Look
SkillOS: Learning Skill Curation for Self-Evolving Agents
Quick Look
STALE: Can LLM Agents Know When Their Memories Are No Longer Valid?
Quick Look
StraTA: Incentivizing Agentic Reinforcement Learning with Strategic Trajectory Abstraction
Quick Look
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems
Quick Look
FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
Quick Look
Reinforcement Learning for LLM-based Multi-Agent Systems through Orchestration Traces
Quick Look
Cited but Not Verified: Parsing and Evaluating Source Attribution in LLM Deep Research Agents
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection