Channels - HexiSeq: Accommodating Long Context Training of LLMs over Heterogeneous Hardware :: FRELIP Discovery

Similar Items: HexiSeq: Accommodating Long Context Training of LLMs over Heterogeneous Hardware

Quick Look
AutoSP: Unlocking Long-Context LLM Training Via Compiler-Based Sequence Parallelism
Quick Look
AGoQ: Activation and Gradient Quantization for Memory-Efficient Distributed Training of LLMs
Quick Look
Coral: Cost-Efficient Multi-LLM Serving over Heterogeneous Cloud GPUs
Quick Look
FedPLT: Scalable, Resource-Efficient, and Heterogeneity-Aware Federated Learning via Partial Layer Training
Quick Look
FalconGEMM: Surpassing Hardware Peaks with Lower-Complexity Matrix Multiplication
Quick Look
Towards Compute-Aware In-Switch Computing for LLMs Tensor-Parallelism on Multi-GPU Systems
Quick Look
MoE-Hub: Taming Software Complexity for Seamless MoE Overlap with Hardware-Accelerated Communication on Multi-GPU Systems
Quick Look
FATE: Future-State-Aware Scheduling for Heterogeneous LLM Workflows
Quick Look
Enhancing Performance Insight at Scale: A Heterogeneous Framework for Exascale Diagnostics
Quick Look
From Coordinate Matching to Structural Alignment: Rethinking Prototype Alignment in Heterogeneous Federated Learning
Quick Look
HiRL: Hierarchical Reinforcement Learning for Coordinated Resource Management in Heterogeneous Edge Computing
Quick Look
Heterogeneous Model Fusion for Privacy-Aware Multi-Camera Surveillance via Synthetic Domain Adaptation
Quick Look
Accelerating Compound LLM Training Workloads with Maestro
Quick Look
Resource-Element Energy Difference for Noncoherent Over-the-Air Federated Learning
Quick Look
Efficient Training on Multiple Consumer GPUs with RoundPipe
Quick Look
Delay-Aware Large-Small Model Collaboration over LEO Satellite Networks
Quick Look
Cloud Performance Decomposition for Long-Term Performance Engineering: A Case Study
Quick Look
ResiHP: Taming LLM Training Failures with Dynamic Hybrid
Quick Look
A Study on the Performance of Distributed Training of Data-driven CFD Simulations
Quick Look
Cross-Layer Energy Analysis of Multimodal Training on Grace Hopper Superchips
Quick Look
Relay Buffer Independent Communication over Pooled HBM for Efficient MoE Inference on Ascend
Quick Look
FedQueue: Queue-Aware Federated Learning for Cross-Facility HPC Training
Quick Look
Lakestream: A Consistent and Brokerless Data Plane for Large Foundation Model Training
Quick Look
ZipCCL: Efficient Lossless Data Compression of Communication Collectives for Accelerating LLM Training