Yao Yao

Publications (Selected | All)

Also find my full publication list at Google Scholar.

Preprint

Lingbot-Map: Geometric Context Transformer for Streaming 3D Reconstruction [paper] [project] [code]

Lin-Zhuo Chen*, Jian Gao*, Yihang Chen, Ka Leong Cheng, Yipengjing Sun, Liangxiao Hu, Nan Xue, Xing Zhu, Yujun Shen, Yao Yao^†, Yinghao Xu^†

arXiv preprint 2604.14141

LingBot-World: Advancing Open-source World Models [paper] [project] [code]

Zelin Gao, Qiuyu Wang, Yanhong Zeng, Jiapeng Zhu, Ka Leong Cheng, Yixuan Li, Hanlin Wang, Yinghao Xu, Shuailei Ma, Yihang Chen, Jie Liu, Yansong Cheng, Yao Yao, Jiayi Zhu, Yihao Meng, Kecheng Zheng, Qingyan Bai, Jingye Chen, Zehong Shen, Yue Yu, Xing Zhu, Yujun Shen, Hao Ouyang

arXiv preprint 2601.20540

Denoise to Track: Harnessing Video Diffusion Priors for Robust Correspondence [paper]

Tianyu Yuan, Yuanbo Yang, Lin-Zhuo Chen, Yao Yao^†, Zhuzhong Qian^†

arXiv preprint 2512.04619

2026

TEXTRIX: Latent Attribute Grid for Native Texture Generation and Beyond [paper] [project]

Yifei Zeng*, Yajie Bao*, Jiachen Qian, Shuang Wu, Youtian Lin, Hao Zhu, Buyu Li, Feihu Zhang, Xun Cao, Yao Yao^*

Computer Vision and Pattern Recognition (CVPR) 2026

SpatialVID: A Large-Scale Video Dataset with Spatial Annotations [paper] [project] [code] [dataset]

Jiahao Wang*, Yufeng Yuan*, Rujie Zheng*, Youtian Lin, Jian Gao, Lin-Zhuo Chen, Yajie Bao, Yi Zhang, Chang Zeng, Yanxi Zhou, Xiaoxiao Long, Hao Zhu, Zhaoxiang Zhang, Xun Cao, Yao Yao^*

Computer Vision and Pattern Recognition (CVPR) 2026

LiteVGGT: Boosting Vanilla VGGT via Geometry-aware Cached Token Merging [paper] [project] [code]

Zhijian Shu, Cheng Lin, Tao Xie, Wei Yin, Ben Li, Zhiyuan Pu, Weize Li, Yao Yao, Xun Cao, Xiaoyang Guo, Xiao-Xiao Long^*

Computer Vision and Pattern Recognition (CVPR) 2026

Pressure2Motion: Hierarchical Human Motion Reconstruction from Ground Pressure with Text Guidance [paper]

Zhengxuan Li, Qinhui Yang, Yiyu Zhuang, Chuan Guo, Xinxin Zuo, Xiaoxiao Long, Yao Yao, Xun Cao, Qiu Shen, Hao Zhu

Computer Vision and Pattern Recognition (CVPR) 2026

ComGS: Efficient 3D Object-Scene Composition via Surface Octahedral Probes [paper] [project]

Jian Gao*, Mengqi Yuan*, Yifei Zeng, Chang Zeng, Zhihao Li, Zhenyu Chen, Weichao Qiu, Xiao-Xiao Long, Hao Zhu, Xun Cao, Yao Yao^*

International Conference on Learning Representations (ICLR) 2026

Anime-Ready: Controllable 3D Anime Character Generation with Body-Aligned Component-Wise Garment Modeling [paper]

Jiachen Qian, Hongye Yang, Youtian Lin, Tianhao Zhao, Hengshuang Zhao, Yao Yao, Feihu Zhang

International Conference on Learning Representations (ICLR) 2026

2025

SlingBAG: point cloud-based iterative algorithm for large-scale 3D photoacoustic imaging [paper]

Shuang Li*, Yibing Wang*, Jian Gao*, Chulhong Kim, Seongwook Choi, Yu Zhang, Qian Chen, Yao Yao^*, Changhui Li^*

Nature Communications 2025

Direct3D‑S2: Gigascale 3D Generation Made Easy with Spatial Sparse Attention [paper] [project] [code] [demo]

Shuang Wu*, Youtian Lin*, Feihu Zhang, Yifei Zeng, Yikang Yang, Yajie Bao, Jiachen Qian, Siyu Zhu, Philip Torr, Xun Cao, Yao Yao^*

Conference on Neural Information Processing Systems (NeurIPS) 2025

Matrix3D: Large Photogrammetry Model All-in-One [paper] [project]

Yuanxun Lu*, Jingyang Zhang*, Tian Fang, Jean-Daniel Nahmias, Yanghai Tsin, Long Quan, Xun Cao, Yao Yao^*, Shiwei Li

Computer Vision and Pattern Recognition (CVPR) 2025 (Highlight)

Mani-GS: Gaussian Splatting Manipulation with Triangular Mesh [paper] [project]

Xiangjun Gao*, Xiaoyu Li*, Yiyu Zhuang, Qi Zhang, Wenbo Hu, Chaopeng Zhang^*, Yao Yao^*, Ying Shan, Long Quan

Computer Vision and Pattern Recognition (CVPR) 2025

FATE: Full-head Gaussian Avatar with Textural Editing from Monocular Video [paper] [project]

Jiawei Zhang, Zijian Wu, Zhiyang Liang, Yicheng Gong, Dongfang Hu, Yao Yao, Xun Cao, Hao Zhu^*

Computer Vision and Pattern Recognition (CVPR) 2025

Flow Distillation Sampling: Regularizing 3D Gaussians with Pre-trained Matching Priors [paper] [project]

Lin-Zhuo Chen*, Kangjie Liu*, Youtian Lin, Zhihao Li, Siyu Zhu, Xun Cao, Yao Yao^*

International Conference on Learning Representations (ICLR) 2025

Hallo2: Long-Duration and High-Resolution Audio-driven Portrait Image Animation [paper] [project]

Jiahao Cui, Hui Li, Yao Yao, Hao Zhu, Hanlin Shang, Kaihui Cheng, Hang Zhou, Siyu Zhu^*, Jingdong Wang

International Conference on Learning Representations (ICLR) 2025

4D Diffusion for Dynamic Protein Structure Prediction with Reference Guided Motion Alignment [paper]

Kaihui Cheng*, Ce Liu*, Qingkun Su, Jun Wang, Liwei Zhang, Yining Tang, Yao Yao, Siyu Zhu^*, Yuan Qi^*

AAAI Conference on Artificial Intelligence (AAAI) 2025

2024

4D SlingBAG: Spatial-temporal Coupled Gaussian Ball for Large-scale Dynamic 3D Photoacoustic Iterative Reconstruction [paper]

Shuang Li*, Yibing Wang*, Jian Gao*, Chulhong Kim, Seongwook Choi, Yu Zhang, Qian Chen, Yao Yao^*, Changhui Li^*

arXiv preprint 2412.03898

Advances in Differentiable Rendering Based on Three-Dimensional Gaussian Splatting (Invited) [paper]

Jian Gao, Linzhuo Chen, Qiu Shen, Xun Cao, Yao Yao

Laser & Optoelectronics Progress, 2024, 61(16): 1611010

Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer [paper] [project]

Shuang Wu*, Youtian Lin*, Feihu Zhang, Yifei Zeng, Jingxi Xu, Philip Torr, Xun Cao, Yao Yao^*

Conference on Neural Information Processing Systems (NeurIPS) 2024

Relightable 3D Gaussian: Real-time Point Cloud Relighting with BRDF Decomposition and Ray Tracing [paper] [project]

Jian Gao*, Chun Gu*, Youtian Lin, Hao Zhu, Xun Cao, Li Zhang^*, Yao Yao^*