Channels - A Scalable Recipe on SuperMUC-NG Phase 2: Efficient Large-Scale Training of Language Models :: FRELIP Discovery

Similar Items: A Scalable Recipe on SuperMUC-NG Phase 2: Efficient Large-Scale Training of Language Models

Quick Look
Piper: Efficient Large-Scale MoE Training via Resource Modeling and Pipelined Hybrid Parallelism
Quick Look
FedPLT: Scalable, Resource-Efficient, and Heterogeneity-Aware Federated Learning via Partial Layer Training
Quick Look
CCL-D: A High-Precision Diagnostic System for Slow and Hang Anomalies in Large-Scale Model Training
Quick Look
Efficient Training on Multiple Consumer GPUs with RoundPipe
Quick Look
AGoQ: Activation and Gradient Quantization for Memory-Efficient Distributed Training of LLMs
Quick Look
Implementing True MPI Sessions and Evaluating MPI Initialization Scalability
Quick Look
Safactory: A Scalable Agent Factory for Trustworthy Autonomous Intelligence
Quick Look
ZipCCL: Efficient Lossless Data Compression of Communication Collectives for Accelerating LLM Training
Quick Look
A Scalable Digital Twin Framework for Energy Optimization in Data Centers
Quick Look
A Semantic Quantum Circuit Cache for Scalable and Distributed Quantum-Classical Workflows
Quick Look
SuperPaymaster: Eliminating Centralized Signer Authority via Asset-Oriented Abstraction to Reconcile Usability and Decentralization in Account Abstraction
Quick Look
Tempus: A Temporally Scalable Resource-Invariant GEMM Streaming Framework for Versal AI Edge
Quick Look
MANOJAVAM: A Scalable, Unified FPGA Accelerator for Matrix Multiplication and Singular Value Decomposition in Principal Component Analysis
Quick Look
End-to-End and Phase-Level Performance Optimization for Hyperledger Fabric
Quick Look
ResiHP: Taming LLM Training Failures with Dynamic Hybrid
Quick Look
Affinity Tailor: Dynamic Locality-Aware Scheduling at Scale
Quick Look
A Study on the Performance of Distributed Training of Data-driven CFD Simulations
Quick Look
Cross-Layer Energy Analysis of Multimodal Training on Grace Hopper Superchips
Quick Look
FedQueue: Queue-Aware Federated Learning for Cross-Facility HPC Training
Quick Look
HexiSeq: Accommodating Long Context Training of LLMs over Heterogeneous Hardware
Quick Look
The Origins of MEV: Systematic Attribution of Arbitrage Opportunity Creation at Scale
Quick Look
Delay-Aware Large-Small Model Collaboration over LEO Satellite Networks
Quick Look
ADELIA: Automatic Differentiation for Efficient Laplace Inference Approximations
Quick Look
Enhancing Performance Insight at Scale: A Heterogeneous Framework for Exascale Diagnostics