开源

🚀 用1k行C代码训练GPT-2，Andrej Karpathy的开源奇迹！

⭐️⭐️⭐️⭐️⭐️

MIT

25.1k

2.9k

Andrej Karpathy的llm.c项目用极简的C代码实现了GPT-2模型的训练，提供了一个不依赖大型机器学习框架的轻量级、高性能的解决方案，同时具有极高的教育价值和实用性。

🌟 你是否想过，仅用1千行C代码就能训练出一个强大的GPT-2模型？Andrej Karpathy做到了！这个项目，llm.c，完全用C和CUDA编写，不依赖任何机器学习框架，代码简洁，可读性高，是学习深度学习的绝佳资源。

🔥 项目亮点：

- 纯C/CUDA实现，无需庞大的PyTorch或cPython。

- 专注于预训练，复现GPT-2和GPT-3迷你系列。

- 与PyTorch参考实现并行，性能略胜一筹。

- 提供简单的CPU和单GPU fp32实现，易于理解和学习。

🛠️ 使用场景：无论是想深入了解GPT模型的工作原理，还是寻求不依赖大型框架的轻量级解决方案，llm.c都是你的不二之选。

📈 优势：代码简洁，易于理解和扩展；性能出色，比PyTorch Nightly快7%；社区活跃，支持多GPU和多节点训练。

C AI 教育