Channels - How Many Iterations to Jailbreak? Dynamic Budget Allocation for Multi-Turn LLM Evaluation :: FRELIP Discovery

Similar Items: How Many Iterations to Jailbreak? Dynamic Budget Allocation for Multi-Turn LLM Evaluation

Quick Look
Continual Knowledge Updating in LLM Systems: Learning Through Multi-Timescale Memory Dynamics
Quick Look
DARTS: Targeting Prognostic Covariates in Budget-Constrained Sequential Experiments
Quick Look
Exact ReLU realization of tensor-product refinement iterates
Quick Look
Low-Cost Black-Box Detection of LLM Hallucinations via Dynamical System Prediction
Quick Look
Adaptive Policy Selection and Fine-Tuning under Interaction Budgets for Offline-to-Online Reinforcement Learning
Quick Look
Evaluating the Architectural Reasoning Capabilities of LLM Provers via the Obfuscated Natural Number Game
Quick Look
Weight-Decay Turns Transformer Loss Landscapes Villani: Functional-Analytic Foundations for Optimization and Generalization
Quick Look
Generating Statistical Charts with Validation-Driven LLM Workflows
Quick Look
Steer Like the LLM: Activation Steering that Mimics Prompting
Quick Look
Beyond Red-Teaming: Formal Guarantees of LLM Guardrail Classifiers
Quick Look
PROMISE-AD: Progression-aware Multi-horizon Survival Estimation for Alzheimer's Disease Progression and Dynamic Tracking
Quick Look
Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous Supervised ML
Quick Look
Observable Performance Does Not Fully Reflect System Organization: A Multi-Level Analysis of Gait Dynamics Under Occlusal Constraint
Quick Look
U-Define: Designing User Workflows for Hard and Soft Constraints in LLM-Based Planning
Quick Look
SLIM: Sparse Latent Steering for Interpretable and Property-Directed LLM-Based Molecular Editing
Quick Look
When No Benchmark Exists: Validating Comparative LLM Safety Scoring Without Ground-Truth Labels
Quick Look
Self-Play Enhancement via Advantage-Weighted Refinement in Online Federated LLM Fine-Tuning with Real-Time Feedback
Quick Look
Multi-fidelity surrogates for mechanics of composites: from co-kriging to multi-fidelity neural networks
Quick Look
Joint Treatment Effect Estimation from Incomplete Healthcare Data: Temporal Causal Normalizing Flows with LLM-driven Evolutionary MNAR Imputation
Quick Look
Decentralized Proximal Stochastic Gradient Langevin Dynamics
Quick Look
Transformed Latent Variable Multi-Output Gaussian Processes
Quick Look
Dynamic Skill Lifecycle Management for Agentic Reinforcement Learning
Quick Look
How Long Does Infinite Width Last? Signal Propagation in Long-Range Linear Recurrences
Quick Look
Quality-Aware Exploration Budget Allocation for Cooperative Multi-Agent Reinforcement Learning