Shuai Wang

Generative Models / Visual Intelligence

I work on scalable training and sampling methods of generative models.

I am a PhD student at Nanjing University, advised by Prof. Limin Wang. My research focuses on scalable training and inference for generative models, mainly diffusion models.

During my undergraduate study at Northwestern Polytechnical University, I was fortunate to learn from Prof. Yuchao Dai and Dr. Bo Li.

Representative works include DDT, whose decoupled diffusion transformer design has been used in follow-up systems such as RAE, PixelDiT, and PixNerd; PixNerd, the first practical large-patch diffusion transformer for pixel-space generation; and UniDDT, which validates scaling across different visual representation spaces and truly unifies multimodal understanding and generation.

Education & Honors

Nanjing University

Ph.D. (direct-track), Computer Science and Technology

2024-25National Scholarship (PhD)
2022-23Tencent Scholarship

2022.09 - Present

Northwestern Polytechnical University

B.E., Computer Science and Technology

2018-19National Scholarship (Undergraduate)

2018.09 - 2022.06

Experience

ByteDance Seed

Research Intern, Seedream Group · large-scale rendered data, text editing

2024.12 - Present

Alibaba Alimama

Research Intern · diffusion step distillation, inference sampling acceleration

2024.04 - 2024.12

SenseTime

Research Intern, autonomous driving perception

2021.12 - 2022.05

Selected Publications

ECCV2026

UniDDT: Unifying Multimodal Understanding and Generation with Decoupled Diffusion Transformer

Shuai Wang, et al.

arXiv HF

CVPR2026

DDT: Decoupled Diffusion Transformer

Shuai Wang, Zhi Tian, Weilin Huang, Limin Wang

arXiv Code

ICLR2026

PixNerd: Pixel Neural Field Diffusion

Shuai Wang, Ziteng Gao, Chenhui Zhu, Weilin Huang, Limin Wang

arXiv Code

ICML2025

Differentiable Solver Search paper thumbnail

Differentiable Solver Search for Fast Diffusion Sampling

Shuai Wang, Zexian Li, Tianhui Song, Xubin Li, Tiezheng Ge, Bo Zheng, Limin Wang

arXiv Code

NeurIPS2024

FlowDCN: Exploring DCN-like Architecture for Fast Image Generation with Arbitrary Resolution

Shuai Wang, Zexian Li, Tianhui Song, Xubin Li, Tiezheng Ge, Bo Zheng, Limin Wang

arXiv Code

TPAMI2025

Deep Equilibrium Object Detection and Segmentation

Shuai Wang, Yao Teng, Limin Wang

Code

ICCV2023

Deep Equilibrium Object Detection

Shuai Wang, Yao Teng, Limin Wang

arXiv Code

Selected collaborations: Cubic Discrete Diffusion (CVPR 2026), Deco (CVPR 2026), MotionRAG (NeurIPS 2026), Flowing Backwards (AAAI 2026), DMM (2025). Full list on Google Scholar.