Channels - Adaptive Policy Selection and Fine-Tuning under Interaction Budgets for Offline-to-Online Reinforcement Learning :: FRELIP Discovery

Similar Items: Adaptive Policy Selection and Fine-Tuning under Interaction Budgets for Offline-to-Online Reinforcement Learning

Quick Look
Self-Play Enhancement via Advantage-Weighted Refinement in Online Federated LLM Fine-Tuning with Real-Time Feedback
Quick Look
Label-Efficient School Detection from Aerial Imagery via Weakly Supervised Pretraining and Fine-Tuning
Quick Look
DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments
Quick Look
Federated Reinforcement Learning for Efficient Mobile Crowdsensing under Incomplete Information
Quick Look
How Many Iterations to Jailbreak? Dynamic Budget Allocation for Multi-Turn LLM Evaluation
Quick Look
Online Bayesian Calibration under Gradual and Abrupt System Changes
Quick Look
SpecKV: Adaptive Speculative Decoding with Compression-Aware Gamma Selection
Quick Look
Fine-Grained Graph Generation through Latent Mixture Scheduling
Quick Look
Interpreting Reinforcement Learning Agents with Susceptibilities
Quick Look
Reinforcement Learning with Markov Risk Measures and Multipattern Risk Approximation
Quick Look
Reinforcement Learning for Exponential Utility: Algorithms and Convergence in Discounted MDPs
Quick Look
Augmented Lagrangian Multiplier Network for State-wise Safety in Reinforcement Learning
Quick Look
Unified Framework of Distributional Regret in Multi-Armed Bandits and Reinforcement Learning
Quick Look
On Adaptivity in Zeroth-Order Optimization
Quick Look
PET-Adapter: Test-Time Domain Adaptation for Full and Limited-Angle PET Image Reconstruction
Quick Look
Adaptive Querying with AI Persona Priors
Quick Look
Learning Equivariant Neural-Augmented Object Dynamics From Few Interactions
Quick Look
Optimal Posterior Sampling for Policy Identification in Tabular Markov Decision Processes
Quick Look
Adaptive Interpolation-Synthesis for Motion In-Betweening on Keyframe-Based Animation
Quick Look
Transformers with Selective Access to Early Representations
Quick Look
NonZero: Interaction-Guided Exploration for Multi-Agent Monte Carlo Tree Search
Quick Look
An adaptive wavelet-based PINN for problems with localized high-magnitude source
Quick Look
TabSurv: Adapting Modern Tabular Neural Networks to Survival Analysis
Quick Look
ProPACT: A Proactive AI-Driven Adaptive Collaborative Tutor for Pair Programming