Publications

9 results at CVPR 2025

SVLTA: Benchmarking Vision-Language Temporal Alignment via Synthetic Video Situations
- - Hao Du
  - Bo Wu
  - et al.
- 2025
- CVPR 2025
MarkushGrapher: Joint Visual and Textual Recognition of Markush Structures
- - Lucas Morin
  - Valery Weber
  - et al.
- 2025
- CVPR 2025
CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment
- - Edson Araujo
  - Andrew Rouditchenko
  - et al.
- 2025
- CVPR 2025
PSBD: Prediction Shift Uncertainty Unlocks Backdoor Detection
- - Wei Li
  - Pin-Yu Chen
  - et al.
- 2025
- CVPR 2025
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues
- - Sagar Soni
  - Akshay Dudhane
  - et al.
- 2025
- CVPR 2025
VP Lab: a PEFT-Enabled Visual Prompting Laboratory for Semantic Segmentation
- - Niccolo Avogaro
  - Thomas Frick
  - et al.
- 2025
- CVPR 2025
Granite Vision: A Demo for Efficient Visual Document Understanding
- - Pengyuan Li
  - Granite Vision Team
- 2025
- CVPR 2025
TerraMesh: A Planetary Mosaic of Multimodal Earth Observation Data
- - Benedikt Blumenstiel
  - Paolo Fraccaro
  - et al.
- 2025
- CVPR 2025
The 2025 CVPR EARTHVISION Data Challenge by Embed2Scale
- - Conrad Albrecht
  - Jannik Schneider
  - et al.
- 2025
- CVPR 2025