Channels - Step Rejection Fine-Tuning: A Practical Distillation Recipe :: FRELIP Discovery

Similar Items: Step Rejection Fine-Tuning: A Practical Distillation Recipe

Quick Look
Trajectory as the Teacher: Few-Step Discrete Flow Matching via Energy-Navigated Distillation
Quick Look
MatryoshkaLoRA: Learning Accurate Hierarchical Low-Rank Representations for LLM Fine-Tuning
Quick Look
Rethinking Local Learning: A Cheaper and Faster Recipe for LLM Post-Training
Quick Look
Benchmarking Parameter-Efficient Fine-Tuning of Large Language Models for Low-Resource Tajik Text Generation with the Tajik Web Corpus
Quick Look
KL for a KL: On-Policy Distillation with Control Variate Baseline
Quick Look
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement
Quick Look
Rebellious Student: Reversing Teacher Signals for Reasoning Exploration with Self-Distilled RLVR
Quick Look
Uncertainty-Aware Structured Data Extraction from Full CMR Reports via Distilled LLMs
Quick Look
D-OPSD: On-Policy Self-Distillation for Continuously Tuning Step-Distilled Diffusion Models
Quick Look
When LLMs Stop Following Steps: A Diagnostic Study of Procedural Execution in Language Models
Quick Look
Beyond Semantics: Measuring Fine-Grained Emotion Preservation in Small Language Model-Based Machine Translation
Quick Look
Natural Language Processing: A Comprehensive Practical Guide from Tokenisation to RLHF
Quick Look
A multilingual hallucination benchmark: MultiWikiQHalluA
Quick Look
Can AI Be a Good Peer Reviewer? A Survey of Peer Review Process, Evaluation, and the Future
Quick Look
A11y-Compressor: A Framework for Enhancing the Efficiency of GUI Agent Observations through Visual Context Reconstruction and Redundancy Reduction
Quick Look
Adapting Large Language Models to a Low-Resource Agglutinative Language: A Comparative Study of LoRA and QLoRA for Bashkir
Quick Look
Reasoning Is Not Free: Robust Adaptive Cost-Efficient Routing for LLM-as-a-Judge
Quick Look
EQUITRIAGE: A Fairness Audit of Gender Bias in LLM-Based Emergency Department Triage
Quick Look
CoCoReviewBench: A Completeness- and Correctness-Oriented Benchmark for AI Reviewers
Quick Look
The Last Word Often Wins: A Format Confound in Chain-of-Thought Corruption Studies
Quick Look
WildClawBench: A Benchmark for Real-World, Long-Horizon Agent Evaluation
Quick Look
MCJudgeBench: A Benchmark for Constraint-Level Judge Evaluation in Multi-Constraint Instruction Following
Quick Look
PairAlign: A Framework for Sequence Tokenization via Self-Alignment with Applications to Audio Tokenization
Quick Look
MRI-Eval: A Tiered Benchmark for Evaluating LLM Performance on MRI Physics and GE Scanner Operations Knowledge