Channels - Text Corpora as Concept Fields: Black-Box Hallucination and Novelty Measurement :: FRELIP Discovery

Similar Items: Text Corpora as Concept Fields: Black-Box Hallucination and Novelty Measurement

Quick Look
The Frequency Confound in Language-Model Surprisal and Metaphor Novelty
Quick Look
A multilingual hallucination benchmark: MultiWikiQHalluA
Quick Look
The First Token Knows: Single-Decode Confidence for Hallucination Detection
Quick Look
Detecting Hallucinations in Large Language Models via Internal Attention Divergence Signals
Quick Look
Logical Consistency as a Bridge: Improving LLM Hallucination Detection via Label Constraint Modeling between Responses and Self-Judgments
Quick Look
FlexSQL: Flexible Exploration and Execution Make Better Text-to-SQL Agents
Quick Look
Segmenting Human-LLM Co-authored Text via Change Point Detection
Quick Look
Feature-Augmented Transformers for Robust AI-Text Detection Across Domains and Generators
Quick Look
Beating the Style Detector: Three Hours of Agentic Research on the AI-Text Arms Race
Quick Look
Rose-SQL: Role-State Evolution Guided Structured Reasoning for Multi-Turn Text-to-SQL
Quick Look
PolySQL: Scaling Text-to-SQL Evaluation Across SQL Dialects via Automated Backend Isomorphism
Quick Look
CA-SQL: Complexity-Aware Inference Time Reasoning for Text-to-SQL via Exploration and Compute Budget Allocation
Quick Look
Benchmarking Parameter-Efficient Fine-Tuning of Large Language Models for Low-Resource Tajik Text Generation with the Tajik Web Corpus
Quick Look
Measuring and Mitigating the Distributional Gap Between Real and Simulated User Behaviors
Quick Look
Beyond Semantics: Measuring Fine-Grained Emotion Preservation in Small Language Model-Based Machine Translation
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
Multi-Level Narrative Evaluation Outperforms Lexical Features for Mental Health
Quick Look
Geometry-Calibrated Conformal Abstention for Language Models
Quick Look
From Unstructured Recall to Schema-Grounded Memory: Reliable AI Memory via Iterative, Schema-Aware Extraction
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection
Quick Look
DPN-LE: Dual Personality Neuron Localization and Editing for Large Language Models
Quick Look
Can AI Be a Good Peer Reviewer? A Survey of Peer Review Process, Evaluation, and the Future
Quick Look
Ease of dependency distance minimization in star-like structures
Quick Look
Models Recall What They Violate: Constraint Adherence in Multi-Turn LLM Ideation