Channels - EvoGround: Self-Evolving Video Agents for Video Temporal Grounding :: FRELIP Discovery

Similar Items: EvoGround: Self-Evolving Video Agents for Video Temporal Grounding

Quick Look
Static and Dynamic Graph Alignment Network for Temporal Video Grounding
Quick Look
Contrastive Learning under Noisy Temporal Self-Supervision for Colonoscopy Videos
Quick Look
Relit-LiVE: Relight Video by Jointly Learning Environment Video
Quick Look
CMTA: Leveraging Cross-Modal Temporal Artifacts for Generalizable AI-Generated Video Detection
Quick Look
Learn where to Click from Yourself: On-Policy Self-Distillation for GUI Grounding
Quick Look
Perceptual Flow Network for Visually Grounded Reasoning
Quick Look
AesRM: Improving Video Aesthetics with Expert-Level Feedback
Quick Look
BAMI: Training-Free Bias Mitigation in GUI Grounding
Quick Look
MedHorizon: Towards Long-context Medical Video Understanding in the Wild
Quick Look
PhyGround: Benchmarking Physical Reasoning in Generative World Models
Quick Look
MMVIAD: Multi-view Multi-task Video Understanding for Industrial Anomaly Detection
Quick Look
CausalCine: Real-Time Autoregressive Generation for Multi-Shot Video Narratives
Quick Look
AnchorD: Metric Grounding of Monocular Depth Using Factor Graphs
Quick Look
Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation
Quick Look
Sparkle: Realizing Lively Instruction-Guided Video Background Replacement via Decoupled Guidance
Quick Look
FreeSpec: Training-Free Long Video Generation via Singular-Spectrum Reconstruction
Quick Look
OmniNFT: Modality-wise Omni Diffusion Reinforcement for Joint Audio-Video Generation
Quick Look
AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation
Quick Look
Seeing Realism from Simulation: Efficient Video Transfer for Vision-Language-Action Data Augmentation
Quick Look
Active Sampling for Ultra-Low-Bit-Rate Video Compression via Conditional Controlled Diffusion
Quick Look
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation
Quick Look
SphereVAD: Training-Free Video Anomaly Detection via Geodesic Inference on the Unit Hypersphere
Quick Look
Does it Really Count? Assessing Semantic Grounding in Text-Guided Class-Agnostic Counting
Quick Look
PhysForge: Generating Physics-Grounded 3D Assets for Interactive Virtual World