Ascend-SACT/Wan2.2-T2V-A14B_I2V-A14
模型介绍文件和版本Pull Requests讨论分析
下载使用量0

1 模型背景介绍

Wan2.2是基础视频模型的一次重大升级。在 Wan2.2 中有以下创新:

有效的MoE架构:Wan2.2 在视频扩散模型中引入了混合专家(MoE)架构。通过使用专门的强大专家模型跨时间步进行去噪过程,这扩大了整体模型容量,同时保持相同的计算成本。 电影级美学:Wan2.2 包含精心策划的美学数据,带有详细的标签,包括照明、构图、对比度、色调等。这使得更精确和可控的电影风格生成成为可能,有助于创建具有可定制美学偏好的视频。 复杂的运动生成:与Wan2.1相比,Wan2.2 在显著更大的数据集上进行训练,图像增加了+65.6%,视频增加了+83.2%。这种扩展显著增强了模型在多个维度上的泛化能力,如运动、语义和美学,并在所有开源和闭源模型中达到了顶级性能。 高效的高清混合TI2V:Wan2.2 开源了一个基于我们先进的Wan2.2-VAE构建的5B模型,实现了16×16×4的压缩比。该模型支持720P分辨率下24fps的文字到视频和图像到视频生成,并且可以在消费级显卡(如4090)上运行。它是目前最快的720P@24fps模型之一,能够同时服务于工业界和学术界。

2 资源列表

2.1 模型部署资源

产品形态:Atlas 800T A2

NPU驱动固件: 25.2.0

CANN软件:CANN 8.3.RC2

torch==2.1.0

torchvision>=0.16.0

opencv-python>=4.9.0.80

diffusers>=0.31.0

transformers==4.54.1

tokenizers>=0.20.3

accelerate==1.9.0

tqdm

imageio[ffmpeg]

easydict

ftfy

dashscope

imageio-ffmpeg

numpy>=1.23.5,<2

yunchang==0.6.0

2.2 参考资源 https://modelers.cn/models/MindIE/Wan2.2/tree/main

https://modelscope.cn/models/Wan-AI/Wan2.2-T2V-A14B

https://modelscope.cn/models/Wan-AI/Wan2.2-I2V-A14B

3 模型开箱部署验证实践

3.1 模型下载

文生视频模型下载链接:https://modelscope.cn/models/Wan-AI/Wan2.2-T2V-A14B

图生视频模型下载链接:https://modelscope.cn/models/Wan-AI/Wan2.2-I2V-A14B

3.2 镜像获取

git lfs install git clone https://atomgit.com/Ascend-SACT/Wan2.2-T2V-A14B_I2V-A14.git

3.3 加载镜像

docker load -i Wan-22-Images.tar docker images

3.4 运行容器

运行容器脚本假设命名为docker_run_wan.sh,内容为:

IMAGES_ID=$1
NAME=$2
if [ $# -ne 2 ]; then
    echo "error: need one argument describing your container name."
    exit 1
fi
docker run --name ${NAME} -it -d --net=host --shm-size=500g \
    --privileged=true \
    -w /home \
    --device=/dev/davinci_manager \
    --device=/dev/hisi_hdc \
    --device=/dev/devmm_svm \
    --entrypoint=bash \
    -v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
    -v /usr/local/dcmi:/usr/local/dcmi \
    -v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
    -v /etc/ascend_install.info:/etc/ascend_install.info \
    -v /usr/local/sbin:/usr/local/sbin \
    -v /home:/home \
    -v /tmp:/tmp \
    -v /mnt:/mnt \
    -v /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime \
    -e http_proxy=$http_proxy \
    -e https_proxy=$https_proxy \
    ${IMAGES_ID}

执行脚本,启动容器:

bash docker_run_wan.sh imagesid wan          # 脚本已上传至魔乐,下载时可一并下载,使用前检查+适配,其中参数imagesid为镜像ID,wan为容器名称,请适配修改
docker exec -it wan /bin/bash