Channels - OmniNFT: Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation :: FRELIP Discovery

Similar Items: OmniNFT: Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation

Quick Look
OmniRobotHome: A Multi-Camera Platform for Real-Time Multiadic Human-Robot Interaction
Quick Look
CMTA: Leveraging Cross-Modal Temporal Artifacts for Generalizable AI-Generated Video Detection
Quick Look
Relit-LiVE: Relight Video by Jointly Learning Environment Video
Quick Look
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation
Quick Look
UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors
Quick Look
Audio-Visual Intelligence in Large Foundation Models
Quick Look
Active Sampling for Ultra-Low-Bit-Rate Video Compression via Conditional Controlled Diffusion
Quick Look
Computer-Aided Design Generation by Cascaded Discrete Diffusion Model
Quick Look
DVD: Discrete Voxel Diffusion for 3D Generation and Editing
Quick Look
CausalCine: Real-Time Autoregressive Generation for Multi-Shot Video Narratives
Quick Look
Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation
Quick Look
FreeSpec: Training-Free Long Video Generation via Singular-Spectrum Reconstruction
Quick Look
Towards Highly-Constrained Human Motion Generation with Retrieval-Guided Diffusion Noise Optimization
Quick Look
MoCoTalk: Multi-Conditional Diffusion with Adaptive Router for Controllable Talking Head Generation
Quick Look
TAFA-GSGC: Group-wise Scalable Point Cloud Geometry Compression with Progressive Residual Refinement
Quick Look
Continuous Latent Diffusion Language Model
Quick Look
MARBLE: Multi-Aspect Reward Balance for Diffusion RL
Quick Look
123D: Unifying Multi-Modal Autonomous Driving Data at Scale
Quick Look
AesRM: Improving Video Aesthetics with Expert-Level Feedback
Quick Look
Static and Dynamic Graph Alignment Network for Temporal Video Grounding
Quick Look
Continuous-Time Distribution Matching for Few-Step Diffusion Distillation
Quick Look
GeoQuery: Geometry-Query Diffusion for Sparse-View Reconstruction
Quick Look
MedHorizon: Towards Long-context Medical Video Understanding in the Wild
Quick Look
Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos