开源

🚀 Llama 3.2-Vision:AI视觉革命来袭!-llama3.2-vision

logo

ollama/llama3.2-vision

Local deployment of the model
logo


摘要

Llama 3.2-Vision,一个由Meta推出的多模态大型语言模型,以其在图像理解和语言生成之间的桥梁作用,成为AI领域的新星。

项目图片

内容

Llama 3.2-Vision,由Meta开发的多模态大型语言模型,以其卓越的视觉识别和图像推理能力,引领AI领域新潮流!🌟 这款模型支持11B和90B两种规模,能够处理文本和图像输入,并输出文本,特别擅长图像描述、视觉识别和回答图像相关问题。🔎 它在多语言任务中表现优异,支持英、德、法、意、葡、印地、西、泰等8种语言,但图像+文本应用仅支持英文。🌐 使用简单,只需一行命令即可调用模型,无论是Python还是JavaScript,都能轻松集成。👨‍💻👩‍💻 社区反馈热烈,期待其在效率、能力和社区支持上的进一步提升。📈

Run the model locally

Id

085a1fdae525

d2a5e64c56a9

61be32b20340

085a1fdae525

7a7cc5461ef1

5ceef0c1d3d2

d2a5e64c56a9

e65e1af5e383

Model

11b

90b

11b-instruct-fp16

11b-instruct-q4_K_M

11b-instruct-q8_0

90b-instruct-fp16

90b-instruct-q4_K_M

90b-instruct-q8_0

Size

7.9GB

55GB

21GB

7.9GB

12GB

177GB

55GB

95GB


关键词

多模态 视觉识别 内容创作

分类

人工智能 图像处理 内容营销
正文到此结束
本文目录