开源

🔥 LLaDA：颠覆传统的语言扩散模型开源神器！🚀

⭐️⭐️

MIT

2.1k

141

LLaDA作为首个大规模语言扩散模型，通过创新性的随机掩码机制和扩散建模策略，在8B参数量级实现了媲美LLaMA3的性能。该项目不仅提供了完整的PyTorch实现和预训练模型，更开创了语言模型与扩散模型融合的新范式，现已成为GitHub上最受关注的开源大模型项目之一。

最近GitHub上有个新晋网红项目——**LLaDA**（Large Language Diffusion with mAsking）简直火到不行！2.1k颗⭐️和141次分支，直接干翻技术圈~

这个由ML-GSAI团队打造的80亿参数级开源模型，居然把**扩散模型**和**大语言模型**这对CP强行凑在一起！要知道传统思路里，BERT搞文本，Stable Diffusion画图，而LLaDA硬生生开辟了"文字变图像"的新赛道🎨。

✨ **三大必试亮点** ✨

1. **随机掩码黑科技**：不像BERT固定15%遮罩率，LLaDA玩的是0-1随机区间，让模型学会动态推理

2. **双版本自由切换**：Base版适合学术研究，Instruct版直接上手对话系统

3. **一键部署神器**：只需`pip install transformers`，配合官方chat.py就能秒建聊天机器人

更绝的是配套的Gradio演示程序，连代码小白都能体验AI作诗→绘图的魔法过程！目前项目已发布论文和基准测试代码，正在招募社区贡献者破解Instruct版的bug悬赏💰。

⚠️ 当前挑战：采样速度还比不过GPT系列，但胜在能做跨模态创作！建议关注5月25日更新的VRPO优化算法，据说能让梯度方差降低40%哦～

Python 文本生成图片 LLM