开源

🚀 MiniCPM-V 2.6:开源多模态AI新突破

logo

ollama/minicpm-v

Local deployment of the model
logo


摘要

MiniCPM-V 2.6以其8B参数量级和多模态处理能力,成为AI领域的新星。它在图像理解、OCR和多语言支持方面表现出色,同时保持高效率和易用性,受到社区的广泛好评。

项目图片

内容

🌟 MiniCPM-V 2.6,作为开源多模态大模型的新宠,以其8B参数量级和卓越的性能,迅速在AI领域崭露头角。基于SigLip-400M和Qwen2-7B构建,它不仅在单图像理解上超越了GPT-4V等商业模型,还在多图像理解、视频理解和上下文学习方面展现了领先地位。🖼️ MiniCPM-V 2.6能够处理高达1.8M像素的任意比例图像,OCR能力超群,支持多语言,且效率惊人,图像编码的token数量仅为640,比大多数模型少75%。🔥 它的出现,不仅满足了对高效率、高精度和易用性的期待,还得到了Hugging Face社区的积极反馈,尽管也有改进空间,如提示工程和文档完善。MiniCPM-V 2.6正成为2025年AI创新的领军者。

Run the model locally

Id

c92bfad01205

f3f122c78635

61cf7cf5edda

a62e8056b1f0

b7c14f8aad8c

0e5dd84b9d34

c92bfad01205

1e17cbffa666

950a671abea6

eda89b106de0

4b28c460b85e

6ac2a6038e89

6dfa70b0f281

b4d3d0c08b9c

ac20b8a12390

9e2efdd7b657

Model

8b

8b-2.6-fp16

8b-2.6-q2_K

8b-2.6-q3_K_L

8b-2.6-q3_K_M

8b-2.6-q3_K_S

8b-2.6-q4_0

8b-2.6-q4_1

8b-2.6-q4_K_M

8b-2.6-q4_K_S

8b-2.6-q5_0

8b-2.6-q5_1

8b-2.6-q5_K_M

8b-2.6-q5_K_S

8b-2.6-q6_K

8b-2.6-q8_0

Size

5.5GB

16GB

4.1GB

5.1GB

4.9GB

4.5GB

5.5GB

5.9GB

5.7GB

5.5GB

6.4GB

6.8GB

6.5GB

6.4GB

7.3GB

9.1GB


关键词

多模态 文档理解 内容创作

分类

自然语言处理 图像处理 内容创作
正文到此结束
本文目录