开源

🚀 开源AI新突破:让静态肖像动起来 —— Hallo登场!

logo

fudan-generative-vision/hallo

⭐️⭐️⭐️⭐️⭐️
logo


License

MIT

Stars

9.7k

Forks

1.3k


项目图片

摘要

Hallo项目是一个创新的音频驱动视觉合成系统,能够将静态肖像图像根据音频变化动态化,提供了丰富的社区资源和简单的使用方式,是AI技术应用的一个新突破。

内容

🌟 Hallo项目,由复旦大学联合百度等机构开发的开源AI项目,最近在GitHub上引起了广泛关注。这个音频驱动的视觉合成系统,能够根据输入的音频和图像生成动态肖像动画,让静态图片仿佛有了生命,随着声音的变化而动起来。

🎬 无论是经典电影《穿普拉达的女王》还是《绿皮书》,Hallo都能让角色的肖像“复活”。项目提供了模型训练代码,允许用户使用自己的训练数据,还有Gradio演示和多种社区贡献资源,如Windows版本、WebUI等,极大地丰富了使用场景。

🔧️ 系统要求不高,只需Ubuntu和Cuda环境,安装简单,使用方便。输入数据要求也很简单,源图像需裁剪成正方形,面部占据图像的50%-70%,且正面朝前。驱动音频需为WAV格式的英语音频。运行推理脚本即可生成动画,结果默认保存为mp4文件。

📈 项目热度持续上升,社区反馈积极,是AI技术爱好者和创意工作者的福音。

关键词

Python AIGC 动态肖像

分类

人工智能 开源软件 创意工具
正文到此结束
本文目录