Channels - GazeVLM: Active Vision via Internal Attention Control for Multimodal Reasoning :: FRELIP Discovery

Similar Items: GazeVLM: Active Vision via Internal Attention Control for Multimodal Reasoning

Quick Look
Detecting Hallucinations in Large Language Models via Internal Attention Divergence Signals
Quick Look
Conformal Path Reasoning: Trustworthy Knowledge Graph Question Answering via Path-Level Calibration
Quick Look
CA-SQL: Complexity-Aware Inference Time Reasoning for Text-to-SQL via Exploration and Compute Budget Allocation
Quick Look
StateVLM: A State-Aware Vision-Language Model for Robotic Affordance Reasoning
Quick Look
Characterizing the Expressivity of Local Attention in Transformers
Quick Look
Long Context Pre-Training with Lighthouse Attention
Quick Look
Self-Attention as Transport: Limits of Symmetric Spectral Diagnostics
Quick Look
Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning
Quick Look
Correct Is Not Enough: Training Reasoning Planners with Executor-Grounded Rewards
Quick Look
Shadow-Loom: Causal Reasoning over Graphical World Model of Narratives
Quick Look
Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key
Quick Look
When Audio-Language Models Fail to Leverage Multimodal Context for Dysarthric Speech Recognition
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
CC-OCR V2: Benchmarking Large Multimodal Models for Literacy in Real-world Document Processing
Quick Look
Accurate Legal Reasoning at Scale: Neuro-Symbolic Offloading and Structural Auditability for Robust Legal Adjudication
Quick Look
Rose-SQL: Role-State Evolution Guided Structured Reasoning for Multi-Turn Text-to-SQL
Quick Look
Beyond Semantics: An Evidential Reasoning-Aware Multi-View Learning Framework for Trustworthy Mental Health Prediction
Quick Look
UFAL-CUNI at SemEval-2026 Task 11: An Efficient Modular Neuro-symbolic Method for Syllogistic Reasoning
Quick Look
Agentic-imodels: Evolving agentic interpretability tools via autoresearch
Quick Look
Segmenting Human-LLM Co-authored Text via Change Point Detection
Quick Look
Trajectory as the Teacher: Few-Step Discrete Flow Matching via Energy-Navigated Distillation
Quick Look
PairAlign: A Framework for Sequence Tokenization via Self-Alignment with Applications to Audio Tokenization
Quick Look
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement
Quick Look
Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs