Channels - CMTA: Leveraging Cross-Modal Temporal Artifacts for Generalizable AI-Generated Video Detection :: FRELIP Discovery

Similar Items: CMTA: Leveraging Cross-Modal Temporal Artifacts for Generalizable AI-Generated Video Detection

Quick Look
Static and Dynamic Graph Alignment Network for Temporal Video Grounding
Quick Look
Generalizable Sparse-View 3D Reconstruction from Unconstrained Images
Quick Look
Stream-R1: Reliability-Perplexity Aware Reward Distillation for Streaming Video Generation
Quick Look
FreeSpec: Training-Free Long Video Generation via Singular-Spectrum Reconstruction
Quick Look
ActCam: Zero-Shot Joint Camera and 3D Motion Control for Video Generation
Quick Look
UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors
Quick Look
Relit-LiVE: Relight Video by Jointly Learning Environment Video
Quick Look
SphereVAD: Training-Free Video Anomaly Detection via Geodesic Inference on the Unit Hypersphere
Quick Look
AEGIS: A Holistic Benchmark for Evaluating Forensic Analysis of AI-Generated Academic Images
Quick Look
123D: Unifying Multi-Modal Autonomous Driving Data at Scale
Quick Look
AesRM: Improving Video Aesthetics with Expert-Level Feedback
Quick Look
MedHorizon: Towards Long-context Medical Video Understanding in the Wild
Quick Look
Sparkle: Realizing Lively Instruction-Guided Video Background Replacement via Decoupled Guidance
Quick Look
Seeing Realism from Simulation: Efficient Video Transfer for Vision-Language-Action Data Augmentation
Quick Look
Active Sampling for Ultra-Low-Bit-Rate Video Compression via Conditional Controlled Diffusion
Quick Look
TimeLesSeg: Unified Contrast-Agnostic Cross-Sectional and Longitudinal MS Lesion Segmentation via a Stochastic Generative Model
Quick Look
Temporally Consistent Object 6D Pose Estimation for Robot Control
Quick Look
PhysEdit: Physically-Consistent Region-Aware Image Editing via Adaptive Spatio-Temporal Reasoning
Quick Look
Representation Fréchet Loss for Visual Generation
Quick Look
Identity-Consistent Multi-Pose Generation of Contactless Fingerprints
Quick Look
Large Language Models are Universal Reasoners for Visual Generation
Quick Look
DCR: Counterfactual Attractor Guidance for Rare Compositional Generation
Quick Look
Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs
Quick Look
Let ViT Speak: Generative Language-Image Pre-training