分享
播了么数字人引擎使用教程
输入“/”快速插入内容
播了么数字人引擎使用教程
用户4262
用户4262
6月11日修改
❗
播了么数字人引擎支持
直播模式和视频模式
:
功能介绍
:
1、支持定制自定义主播形象(无数量限制)
2、支持任意音频驱动对口型
3、支持离线音频对口型制作ip口播视频
4、支持实时直播对口型
所有数据及模型均保存在本地,无联网
数字人版硬件条件(
点击查看不同配置帧率
)
制作视频:
如果只是用来制作口播类视频,没有实时推理需求的:硬件要求N卡即可,显存2G即可。
实时直播:
数字人版本是本地运行,
显卡需要N卡
,实测显存占用不超过2G ,保险起见,建议显存不低于8G!cpu i5 十代以上,内存32G
❗
播了么数字人引擎 下载/更新地址
链接:
https://pan.baidu.com/s/1n5s7xAoS5avNAv2JersPiw?pwd=cpqz
提取码: cpqz
i512400f 16G + 2060s 8G显存 跑播了么本地Omnivoice+播了么数字人 帧率在18-20之间 会掉一点帧 但也能用卧槽
前言必看
素材要求:
720p/1080p均可、25 帧最好、正面、无遮挡、得有光线照亮脸部、小幅度动作
不适合的素材(基于heygem实现的通病):
•
手挡脸 → 检测失败或盲贴
•
抬头/侧脸 → 关键点全部偏斜,俗称穿帮
❗
素材开口说话或者闭口素材都可以,自己录的时候闭口的素材效果会更好!为了保证整体自然,建议主播默念话术或者张口念出来,整个肢体会更自然。人脸尽量保持正对镜头!
实时摄像头模式下
:人物动作不可预测!因此还是要遵循正脸对镜头,不可有大幅头部动作。实时摄像头模式下分辨率不要超过720p!
基础功能介绍
直播模式 —— 用于直播
本地主播模式
通过添加已录制好的素材,通过音频驱动实时换口型!
添加主播
❗
开口讲话的素材、闭口素材都可以,程序都会默认按照闭口预处理一遍