本目录用于存放 FlashVSR v1.1 推理所需的权重文件,主要面向:
backend/ + frontend/);注意:本目录不包含任何训练代码,仅包含推理所需权重与简要说明。
算法与实现来自官方开源项目 OpenImagingLab/FlashVSR。
放置在 backend/models/FlashVSR-v1.1/ 下时,通常包含以下文件:
diffusion_pytorch_model_streaming_dmd.safetensors
FlashVSR 主体扩散模型(流式 one-step VSR)。
LQ_proj_in.ckpt
LQ(低清)特征投影层权重,用于将输入视频特征映射到 WanVideo 语义空间。
TCDecoder.ckpt
Tiny Conditional Decoder / Temporal Consistency Decoder 的权重,用于加速重建并增强时序一致性。
Wan2.1_VAE.pth
Wan 视频 VAE 相关权重(当前 Tiny Long 会复用部分模块,用于编码 / 解码空间)。
posi_prompt.pth
位置 prompt tensor,用于初始化 cross-attention 的 KV 缓存(Cross KV),保证推理稳定。
README.md
本说明文件,可直接作为 ModelScope 或其它模型平台的介绍文档。
权重文件总体积约数 GB 级,不建议直接提交到 Git 仓库。推荐统一放在外部模型仓库(如 ModelScope)或对象存储中,然后在部署时同步到本目录。
FlashVSR-app 默认假设权重位于:
backend/backend/models/FlashVSR-v1.1对应配置(backend/app/config.py)为:
MODEL_ROOT = BACKEND_ROOT / "models"FLASHVSR_MODEL_PATH = MODEL_ROOT / "FlashVSR-v1.1"FLASHVSR_PROMPT_TENSOR_PATH = FLASHVSR_MODEL_PATH / "posi_prompt.pth"在应用仓库根目录创建目录:
mkdir -p backend/models/FlashVSR-v1.1将上述权重文件放入该目录(例如从 ModelScope 下载后解压到此处):
ls backend/models/FlashVSR-v1.1
# diffusion_pytorch_model_streaming_dmd.safetensors
# LQ_proj_in.ckpt
# TCDecoder.ckpt
# Wan2.1_VAE.pth
# posi_prompt.pth
# README.md如需自定义路径,可以在 backend/.env 中覆盖:
# 例如放在 /data/flashvsr/FlashVSR-v1.1 下
FLASHVSR_MODEL_PATH="/data/flashvsr/FlashVSR-v1.1"
FLASHVSR_PROMPT_TENSOR_PATH="/data/flashvsr/FlashVSR-v1.1/posi_prompt.pth"启动后端时,FlashVSRService.inspect_assets() 会检查上述文件是否存在,并在 /api/system/status 中展示 Tiny Long 变体的就绪状态。
当你把本目录上传到 ModelScope 作为一个模型条目(例如 video-to-video 管线),可以在模型卡片中:
OpenImagingLab/FlashVSR 官方仓库v1.1,Tiny Long 变体的推理权重在 FlashVSR-app 中使用时,推荐流程为:
/data/modelscope/FlashVSR-v1.1-tiny-long。backend/.env 中将 FLASHVSR_MODEL_PATH 指向该目录(参见上一节)。若你使用的是 ModelScope Python SDK,也可以在 SDK 中先下载模型到本地,再将下载路径填入
FLASHVSR_MODEL_PATH,具体用法请参考 ModelScope 官方文档。
FlashVSRTinyLongPipeline)。本权重包遵循上游 FlashVSR 的许可证(Apache 2.0)。在科研或产品中使用时,请遵守原项目的许可条款并引用原论文:
@misc{zhuang2025flashvsrrealtimediffusionbasedstreaming,
title={FlashVSR: Towards Real-Time Diffusion-Based Streaming Video Super-Resolution},
author={Junhao Zhuang and Shi Guo and Xin Cai and Xiaohui Li and Yihao Liu and Chun Yuan and Tianfan Xue},
year={2025},
eprint={2510.12747},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2510.12747},
}如需了解更多实现细节、Block-Sparse Attention 依赖及训练设置,请参考官方仓库文档。