Channels - Static and Dynamic Graph Alignment Network for Temporal Video Grounding :: FRELIP Discovery

Similar Items: Static and Dynamic Graph Alignment Network for Temporal Video Grounding

Quick Look
CMTA: Leveraging Cross-Modal Temporal Artifacts for Generalizable AI-Generated Video Detection
Quick Look
AnchorD: Metric Grounding of Monocular Depth Using Factor Graphs
Quick Look
Perceptual Flow Network for Visually Grounded Reasoning
Quick Look
DynoSLAM: Dynamic SLAM with Generative Graph Neural Networks for Real-World Social Navigation
Quick Look
Relit-LiVE: Relight Video by Jointly Learning Environment Video
Quick Look
Wasserstein-Aligned Localisation for VLM-Based Distributional OOD Detection in Medical Imaging
Quick Look
AesRM: Improving Video Aesthetics with Expert-Level Feedback
Quick Look
BAMI: Training-Free Bias Mitigation in GUI Grounding
Quick Look
PRISM: Pre-alignment via Black-box On-policy Distillation for Multimodal Reinforcement Learning
Quick Look
SAIL: Structure-Aware Interpretable Learning for Anatomy-Aligned Post-hoc Explanations in OCT
Quick Look
MedHorizon: Towards Long-context Medical Video Understanding in the Wild
Quick Look
Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation
Quick Look
Sparkle: Realizing Lively Instruction-Guided Video Background Replacement via Decoupled Guidance
Quick Look
FreeSpec: Training-Free Long Video Generation via Singular-Spectrum Reconstruction
Quick Look
Learn where to Click from Yourself: On-Policy Self-Distillation for GUI Grounding
Quick Look
Seeing Realism from Simulation: Efficient Video Transfer for Vision-Language-Action Data Augmentation
Quick Look
Active Sampling for Ultra-Low-Bit-Rate Video Compression via Conditional Controlled Diffusion
Quick Look
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation
Quick Look
Does it Really Count? Assessing Semantic Grounding in Text-Guided Class-Agnostic Counting
Quick Look
PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World
Quick Look
UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors
Quick Look
Temporally Consistent Object 6D Pose Estimation for Robot Control
Quick Look
Paired-CSLiDAR: Height-Stratified Registration for Cross-Source Aerial-Ground LiDAR Pose Refinement
Quick Look
PhysEdit: Physically-Consistent Region-Aware Image Editing via Adaptive Spatio-Temporal Reasoning