开源

小巧强大!Hugging Face 推出 SmolLM 系列模型 🤖

logo

huggingface/smollm

⭐️⭐️
logo


License

Apache-2.0

Stars

3k

Forks

198


项目图片

摘要

Hugging Face 最近推出了一款名为 SmolLM 的轻量级 AI 模型系列,旨在提供高效且易于部署的解决方案。SmolLM3 在 3B 参数规模下表现出色,并且训练细节完全透明。SmolVLM 则是结合了文本和图像处理能力的多模态模型。该项目不仅开源,还提供了丰富的资源帮助用户快速上手。

内容

最近,Hugging Face 在 GitHub 上推出了全新的 AI 模型系列——Smol Models。这个项目的目标是打造轻量且高效的模型,让它们可以在设备上运行,同时保持强大的性能。

SmolLM3 是该系列中的新成员,它在 3B 参数规模下表现优异,甚至能与更大规模的模型如 Qwen3 和 Gemma3 相媲美。更棒的是,它的训练过程完全公开,包括数据集和配置信息,这对于研究者和开发者来说非常友好。

除了文本处理,SmolVLM 还支持图像和视频内容的理解。它可以进行视觉问答、图像描述等任务,并且能够在一个对话中处理多张图片。这种多功能性让它在实际应用中更加灵活。

如果你对这类模型感兴趣,可以尝试在本地部署这些模型。使用 Transformers 库就可以轻松加载和运行 SmolLM3 或 SmolVLM。只需几行代码,就能开始体验其强大的功能。

该项目还提供了一些实用工具,比如 smollm_local_inference 和 smolvlm_local_inference,方便用户快速搭建自己的推理系统。此外,还有专门的数据集用于增强模型的知识和技能,例如 SmolTalk、FineMath 和 FineWeb-Edu。

对于想要了解如何开始使用的读者,项目的 README 文件提供了详细的入门指南。无论你是想做基本的文本生成,还是希望构建一个能够处理图像的智能助手,Smol Models 都是一个不错的选择。

更多详情可查看 Hugging Face 的官方文档或访问项目主页获取最新动态。欢迎讨论,分享你的使用经验吧!

关键词

Python 文本生成 LLM

分类

AI开发 教育培训 多模态
正文到此结束
本文目录