Channels - Global Optimality for Constrained Exploration via Penalty Regularization :: FRELIP Discovery

Similar Items: Global Optimality for Constrained Exploration via Penalty Regularization

Quick Look
Penalty-Based First-Order Methods for Bilevel Optimization with Minimax and Constrained Lower-Level Problems
Quick Look
Globally Optimal Training of Spiking Neural Networks via Parameter Reconstruction
Quick Look
DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments
Quick Look
Proximal Projection for Doubly Sparse Regularized Models
Quick Look
Ecologically-Constrained Task Arithmetic for Multi-Taxa Bioacoustic Classifiers Without Shared Data
Quick Look
Exploration Hacking: Can LLMs Learn to Resist RL Training?
Quick Look
Optimizer-Model Consistency: Full Finetuning with the Same Optimizer as Pretraining Forgets Less
Quick Look
UniPool: A Globally Shared Expert Pool for Mixture-of-Experts
Quick Look
On Adaptivity in Zeroth-Order Optimization
Quick Look
Robust and Fast Training via Per-Sample Clipping
Quick Look
Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous Supervised ML
Quick Look
NonZero: Interaction-Guided Exploration for Multi-Agent Monte Carlo Tree Search
Quick Look
Universality in Deep Neural Networks: An approach via the Lindeberg exchange principle
Quick Look
EASE: Federated Multimodal Unlearning via Entanglement-Aware Anchor Closure
Quick Look
Transformers Efficiently Perform In-Context Logistic Regression via Normalized Gradient Descent
Quick Look
Zero-Shot Imagined Speech Decoding via Imagined-to-Listened MEG Mapping
Quick Look
Evaluating the Architectural Reasoning Capabilities of LLM Provers via the Obfuscated Natural Number Game
Quick Look
FedKPer: Tackling Generalization and Personalization in Medical Federated Learning via Knowledge Personalization
Quick Look
Flow Sampling: Learning to Sample from Unnormalized Densities via Denoising Conditional Processes
Quick Look
Low-Cost Black-Box Detection of LLM Hallucinations via Dynamical System Prediction
Quick Look
Auto-FlexSwitch: Efficient Dynamic Model Merging via Learnable Task Vector Compression
Quick Look
A second-order method on the Stiefel manifold via Newton$unicode{x2013}$Schulz
Quick Look
Optimal Posterior Sampling for Policy Identification in Tabular Markov Decision Processes
Quick Look
Label-Efficient School Detection from Aerial Imagery via Weakly Supervised Pretraining and Fine-Tuning