🚀 开源AI新突破:让静态肖像动起来 —— Hallo登场!
License
MIT
Stars
9.7k
Forks
1.3k

摘要
Hallo项目是一个创新的音频驱动视觉合成系统,能够将静态肖像图像根据音频变化动态化,提供了丰富的社区资源和简单的使用方式,是AI技术应用的一个新突破。
内容
🌟 Hallo项目,由复旦大学联合百度等机构开发的开源AI项目,最近在GitHub上引起了广泛关注。这个音频驱动的视觉合成系统,能够根据输入的音频和图像生成动态肖像动画,让静态图片仿佛有了生命,随着声音的变化而动起来。
🎬 无论是经典电影《穿普拉达的女王》还是《绿皮书》,Hallo都能让角色的肖像“复活”。项目提供了模型训练代码,允许用户使用自己的训练数据,还有Gradio演示和多种社区贡献资源,如Windows版本、WebUI等,极大地丰富了使用场景。
🔧️ 系统要求不高,只需Ubuntu和Cuda环境,安装简单,使用方便。输入数据要求也很简单,源图像需裁剪成正方形,面部占据图像的50%-70%,且正面朝前。驱动音频需为WAV格式的英语音频。运行推理脚本即可生成动画,结果默认保存为mp4文件。
📈 项目热度持续上升,社区反馈积极,是AI技术爱好者和创意工作者的福音。
关键词
Python AIGC 动态肖像
分类
人工智能 开源软件 创意工具
正文到此结束