Channels - DGPO: Beyond Pairwise Preferences with Directional Consistent Groupwise Optimization :: FRELIP Discovery

Similar Items: DGPO: Beyond Pairwise Preferences with Directional Consistent Groupwise Optimization

Quick Look
Beyond Negative Rollouts: Positive-Only Policy Optimization with Implicit Negative Gradients
Quick Look
Misaligned by Reward: Socially Undesirable Preferences in LLMs
Quick Look
Towards Emotion Consistency Analysis of Large Language Models in Emotional Conversational Contexts
Quick Look
SC-Taxo: Hierarchical Taxonomy Generation under Semantic Consistency Constraints using Large Language Models
Quick Look
Logical Consistency as a Bridge: Improving LLM Hallucination Detection via Label Constraint Modeling between Responses and Self-Judgments
Quick Look
Beyond Decodability: Reconstructing Language Model Representations with an Encoding Probe
Quick Look
Beyond Benchmarks: MathArena as an Evaluation Platform for Mathematics with LLMs
Quick Look
Beyond Confidence: Rethinking Self-Assessments for Performance Prediction in LLMs
Quick Look
Surprisal Minimisation over Goal-directed Alternatives Predicts Production Choice in Dialogue
Quick Look
Beyond "I cannot fulfill this request": Alleviating Rigid Rejection in LLMs via Label Enhancement
Quick Look
Directed Social Regard: Surfacing Targeted Advocacy, Opposition, Aid, Harms, and Victimization in Online Media
Quick Look
Beyond Semantics: Measuring Fine-Grained Emotion Preservation in Small Language Model-Based Machine Translation
Quick Look
Beyond Semantics: An Evidential Reasoning-Aware Multi-View Learning Framework for Trustworthy Mental Health Prediction
Quick Look
Reinforcement Learning for Compositional Generalization with Outcome-Level Optimization
Quick Look
Latent-GRPO: Group Relative Policy Optimization for Latent Reasoning
Quick Look
MASPO: Joint Prompt Optimization for LLM-based Multi-Agent Systems
Quick Look
OrScale: Orthogonalised Optimization with Layer-Wise Trust-Ratio Scaling
Quick Look
Learning How and What to Memorize: Cognition-Inspired Two-Stage Optimization for Evolving Memory
Quick Look
Reasoning over Object Descriptions Improves Coreference Resolution in Task-Based Dialogue Systems
Quick Look
Multi-Level Narrative Evaluation Outperforms Lexical Features for Mental Health
Quick Look
Geometry-Calibrated Conformal Abstention for Language Models
Quick Look
From Unstructured Recall to Schema-Grounded Memory: Reliable AI Memory via Iterative, Schema-Aware Extraction
Quick Look
MM-StanceDet: Retrieval-Augmented Multi-modal Multi-agent Stance Detection
Quick Look
DPN-LE: Dual Personality Neuron Localization and Editing for Large Language Models