Channels - Characterizing the Expressivity of Local Attention in Transformers :: FRELIP Discovery

Similar Items: Characterizing the Expressivity of Local Attention in Transformers

Quick Look
Long Context Pre-Training with Lighthouse Attention
Quick Look
Self-Attention as Transport: Limits of Symmetric Spectral Diagnostics
Quick Look
Detecting Hallucinations in Large Language Models via Internal Attention Divergence Signals
Quick Look
GazeVLM: Active Vision via Internal Attention Control for Multimodal Reasoning
Quick Look
Can RL Teach Long-Horizon Reasoning to LLMs? Expressiveness Is Key
Quick Look
Task Vector Geometry Underlies Dual Modes of Task Inference in Transformers
Quick Look
Feature-Augmented Transformers for Robust AI-Text Detection Across Domains and Generators
Quick Look
DPN-LE: Dual Personality Neuron Localization and Editing for Large Language Models
Quick Look
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
Multi-Level Narrative Evaluation Outperforms Lexical Features for Mental Health
Quick Look
Geometry-Calibrated Conformal Abstention for Language Models
Quick Look
From Unstructured Recall to Schema-Grounded Memory: Reliable AI Memory via Iterative, Schema-Aware Extraction
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection
Quick Look
Can AI Be a Good Peer Reviewer? A Survey of Peer Review Process, Evaluation, and the Future
Quick Look
Beyond Semantics: Measuring Fine-Grained Emotion Preservation in Small Language Model-Based Machine Translation
Quick Look
Ease of dependency distance minimization in star-like structures
Quick Look
Models Recall What They Violate: Constraint Adherence in Multi-Turn LLM Ideation
Quick Look
Universal statistical laws governing culinary design
Quick Look
Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning
Quick Look
Repetition over Diversity: High-Signal Data Filtering for Sample-Efficient German Language Modeling
Quick Look
Stable Behavior, Limited Variation: Persona Validity in LLM Agents for Urban Sentiment Perception
Quick Look
Mapping the Methodological Space of Classroom Interaction Research: Scale, Duration, and Modality in an Age of AI
Quick Look
On the Proper Treatment of Units in Surprisal Theory