Wan2.2是基础视频模型的一次重大升级。在 Wan2.2 中有以下创新:
有效的MoE架构:Wan2.2 在视频扩散模型中引入了混合专家(MoE)架构。通过使用专门的强大专家模型跨时间步进行去噪过程,这扩大了整体模型容量,同时保持相同的计算成本。 电影级美学:Wan2.2 包含精心策划的美学数据,带有详细的标签,包括照明、构图、对比度、色调等。这使得更精确和可控的电影风格生成成为可能,有助于创建具有可定制美学偏好的视频。 复杂的运动生成:与Wan2.1相比,Wan2.2 在显著更大的数据集上进行训练,图像增加了+65.6%,视频增加了+83.2%。这种扩展显著增强了模型在多个维度上的泛化能力,如运动、语义和美学,并在所有开源和闭源模型中达到了顶级性能。 高效的高清混合TI2V:Wan2.2 开源了一个基于我们先进的Wan2.2-VAE构建的5B模型,实现了16×16×4的压缩比。该模型支持720P分辨率下24fps的文字到视频和图像到视频生成,并且可以在消费级显卡(如4090)上运行。它是目前最快的720P@24fps模型之一,能够同时服务于工业界和学术界。
2.2 参考资源 https://modelers.cn/models/MindIE/Wan2.2/tree/main
https://modelscope.cn/models/Wan-AI/Wan2.2-T2V-A14B
https://modelscope.cn/models/Wan-AI/Wan2.2-I2V-A14B
文生视频模型下载链接:https://modelscope.cn/models/Wan-AI/Wan2.2-T2V-A14B
图生视频模型下载链接:https://modelscope.cn/models/Wan-AI/Wan2.2-I2V-A14B
git lfs install git clone https://atomgit.com/Ascend-SACT/Wan2.2-T2V-A14B_I2V-A14.git
docker load -i Wan-22-Images.tar docker images
运行容器脚本假设命名为docker_run_wan.sh,内容为:
IMAGES_ID=$1
NAME=$2
if [ $# -ne 2 ]; then
echo "error: need one argument describing your container name."
exit 1
fi
docker run --name ${NAME} -it -d --net=host --shm-size=500g \
--privileged=true \
-w /home \
--device=/dev/davinci_manager \
--device=/dev/hisi_hdc \
--device=/dev/devmm_svm \
--entrypoint=bash \
-v /usr/local/Ascend/driver:/usr/local/Ascend/driver \
-v /usr/local/dcmi:/usr/local/dcmi \
-v /usr/local/bin/npu-smi:/usr/local/bin/npu-smi \
-v /etc/ascend_install.info:/etc/ascend_install.info \
-v /usr/local/sbin:/usr/local/sbin \
-v /home:/home \
-v /tmp:/tmp \
-v /mnt:/mnt \
-v /usr/share/zoneinfo/Asia/Shanghai:/etc/localtime \
-e http_proxy=$http_proxy \
-e https_proxy=$https_proxy \
${IMAGES_ID}
执行脚本,启动容器:
bash docker_run_wan.sh imagesid wan # 脚本已上传至魔乐,下载时可一并下载,使用前检查+适配,其中参数imagesid为镜像ID,wan为容器名称,请适配修改
docker exec -it wan /bin/bash