开源

🚀 开源新突破!Snowflake Arctic Embed 2.0:多语言搜索的利器-snowflake-arctic-embed2

logo

ollama/snowflake-arctic-embed2

Local deployment of the model
logo


摘要

Snowflake Arctic Embed 2.0,一款支持多语言的开源嵌入模型,以其卓越的性能和效率在机器学习领域引起广泛关注。

项目图片

内容

Snowflake公司最近发布了Arctic Embed 2.0模型,这款开源的前沿嵌入模型🌐,支持多语言搜索,备受开源社区和企业用户的青睐。Arctic Embed 2.0在保持英文性能和可扩展性的同时,增加了对多种语言的支持,满足了广泛用户群体的需求。

🔍 功能亮点:

- 企业级吞吐量和效率:即使是“大型”模型,参数也少于10亿,能在NVIDIA A10 GPU上每秒处理超100份文档,查询嵌入延迟低于10毫秒,适合预算友好的硬件部署。

- 英文和非英文检索的卓越质量:两款模型在多种语言的基准数据集上均获得高nDCG@10分数,即使在训练中未包含的语言也能良好泛化。

- 通过Matryoshka表示学习(MRL)实现可扩展检索:用户可以在大数据集上以极低的成本和优化的规模进行搜索,每个向量仅128字节。

- 真正的开源:Apache 2.0许可,自由使用。

🌟 用户反馈热烈,期待其性能优化和资源利用的进一步提升。

Run the model locally

Id

5de93a84837d

5de93a84837d

Model

568m

568m-l-fp16

Size

1.2GB

1.2GB


关键词

自然语言处理 文本向量 推荐系统

分类

搜索引擎 数据科学 多语言支持
正文到此结束
本文目录