Channels - One Pool, Two Caches: Adaptive HBM Partitioning for Accelerating Generative Recommender Serving :: FRELIP Discovery

Similar Items: One Pool, Two Caches: Adaptive HBM Partitioning for Accelerating Generative Recommender Serving

Quick Look
Position-Aware Drafting for Inference Acceleration in LLM-Based Generative List-Wise Recommendation
Quick Look
Expressiveness Limits of Autoregressive Semantic ID Generation in Generative Recommendation
Quick Look
Unified Value Alignment for Generative Recommendation in Industrial Advertising
Quick Look
One Pass, Any Order: Position-Invariant Listwise Reranking for LLM-Based Recommendation
Quick Look
CapsID: Soft-Routed Variable-Length Semantic IDs for Generative Recommendation
Quick Look
Multi-Axis Speech Similarity via Factor-Partitioned Embeddings
Quick Look
Empirical Study of Pop and Jazz Mix Ratios for Genre-Adaptive Chord Generation
Quick Look
Factorized Latent Reasoning for LLM-based Recommendation
Quick Look
DynamicPO: Dynamic Preference Optimization for Recommendation
Quick Look
TRACE: Tourism Recommendation with Accountable Citation Evidence
Quick Look
A Gated Hybrid Contrastive Collaborative Filtering Recommendation
Quick Look
Rethinking Convolutional Networks for Attribute-Aware Sequential Recommendation
Quick Look
Effective Knowledge Transfer for Multi-Task Recommendation Models
Quick Look
Aspect-Aware Content-Based Recommendations for Mathematical Research Papers
Quick Look
Bridging Behavior and Semantics for Time-aware Cross-Domain Sequential Recommendation
Quick Look
Time-Interval-Aware Disentangled Expert Modeling for Next-Basket Recommendation
Quick Look
Robust Multimodal Recommendation via Graph Retrieval-Enhanced Modality Completion
Quick Look
The Bandit's Blind Spot: The Critical Role of User State Representation in Recommender Systems
Quick Look
Investigating the Effects of Different Levels of User Control in an Interactive Educational Recommender System
Quick Look
Light-FMP: Lightweight Feature and Model Pruning for Enhanced Deep Recommender Systems
Quick Look
RRCM: Ranking-Driven Retrieval over Collaborative and Meta Memories for LLM Recommendation
Quick Look
An Embarrassingly Simple Graph Heuristic Reveals Shortcut-Solvable Benchmarks for Sequential Recommendation
Quick Look
Beyond Static Best-of-N: Bayesian List-wise Alignment for LLM-based Recommendation
Quick Look
Bridging Passive and Active: Enhancing Conversation Starter Recommendation via Active Expression Modeling