开源

🚀探索多模态AI新纪元:LLaVA模型全解析🌟

logo

ollama/llava

Local deployment of the model
logo


摘要

LLaVA模型是一款结合视觉编码器和Vicuna的大型语言视觉助手,支持高分辨率图像输入,提升视觉推理和OCR能力,适用于多模态对话和视觉理解场景。

项目图片

内容

在AI的世界里,多模态技术正变得越来越重要。👀💬 今天,我们来聊聊LLaVA模型——一款结合视觉编码器和Vicuna的大型语言视觉助手。🌐🤖 LLaVA 1.6版本带来了革命性的更新:支持高达4倍像素的图像输入,覆盖了672x672、336x1344、1344x336等分辨率,让视觉推理和OCR能力更上一层楼。📈🔍 无论是视觉对话还是世界知识逻辑推理,LLaVA都能轻松应对,为你的多模态应用带来无限可能。

使用LLaVA,你可以通过CLI或API轻松接入。CLI使用时,只需运行模型并提供图像路径;API则通过简单的curl命令即可实现。📁🔌 无论是开发者还是AI爱好者,LLaVA都能满足你对多模态AI的期待。

快来体验LLaVA,开启你的多模态AI之旅吧!🚀🌈

Run the model locally

Id

8dd30f6b0cb1

0d0eb4d7f485

3d2d24f46674

ce3bde71eaa7

3cdd3869f154

07b1b74ec398

61441e82808c

c860f869008d

e3b7997801dc

0ca30ff66062

d0a6a3f0e6c4

16939c152bd9

78e17026912a

b11f33bc65fa

48418b116e18

c7f4b8076a0e

3c085b55f924

4e00c435bb25

0d0eb4d7f485

81e28406a4e9

87aecb135e2a

a2b56a2b8e79

2e48f094b51a

54ef03322645

0d0eb4d7f485

0b97528b26b0

0843119c3874

5e4cf96dfc4c

6e06e1393058

31f1d78cb272

446b10458a6a

53999e2c86c8

1c0a91e1e4d9

b25c4195f9e2

3d2d24f46674

89c50af82d5e

6326f59da4f1

7f9889648d1a

89e924fed7d4

a0376a205682

3d2d24f46674

96d20de28a1a

538ff4c5a8b8

787b2213f0db

b239e218bdf0

60926fd725ec

0eb2ab10d35c

cdd8d5db3870

8f572ea02185

959065f30849

337a5b25bada

33973d2589d1

057fefd59cdb

9d738df24288

605b68e0b568

cd3274b81a85

146a55d9df75

75a9333e75cd

d8d545afa5f0

339249626980

6d97e8715c53

4fb097b9cfa3

34f9b24f2315

df0203e92f79

c684b68b3f34

8dd30f6b0cb1

9fd1e5417c5f

52e0ce44a5f5

a48bbc9b567b

25a00600f8b4

2b9c055fe6a2

8dd30f6b0cb1

8da3213068e6

8d3fbd6ad3f4

2878e8c79f6e

b8f63553f521

eda0b3f3b09b

244b7e3d3d5a

62dc434a7ae8

8781169d7f8f

c2973e390e84

bb8da134bacb

6321163f3833

0127d9087e07

7004e1f24eb1

7701df672950

b6cbe07f1d5e

f8a27e237e97

15360a9e0fb9

5006a8a41d2b

6a2bb61a611a

1bd37032ec33

b22b0c041223

4aaa19502e34

11bd55683f9c

6da20a71d9bb

8dd30f6b0cb1

Model

7b

13b

34b

13b-v1.5-fp16

13b-v1.5-q2_K

13b-v1.5-q3_K_L

13b-v1.5-q3_K_M

13b-v1.5-q3_K_S

13b-v1.5-q4_0

13b-v1.5-q4_1

13b-v1.5-q4_K_M

13b-v1.5-q4_K_S

13b-v1.5-q5_0

13b-v1.5-q5_1

13b-v1.5-q5_K_M

13b-v1.5-q5_K_S

13b-v1.5-q6_K

13b-v1.5-q8_0

13b-v1.6

13b-v1.6-vicuna-fp16

13b-v1.6-vicuna-q2_K

13b-v1.6-vicuna-q3_K_L

13b-v1.6-vicuna-q3_K_M

13b-v1.6-vicuna-q3_K_S

13b-v1.6-vicuna-q4_0

13b-v1.6-vicuna-q4_1

13b-v1.6-vicuna-q4_K_M

13b-v1.6-vicuna-q4_K_S

13b-v1.6-vicuna-q5_0

13b-v1.6-vicuna-q5_1

13b-v1.6-vicuna-q5_K_M

13b-v1.6-vicuna-q5_K_S

13b-v1.6-vicuna-q6_K

13b-v1.6-vicuna-q8_0

34b-v1.6

34b-v1.6-fp16

34b-v1.6-q2_K

34b-v1.6-q3_K_L

34b-v1.6-q3_K_M

34b-v1.6-q3_K_S

34b-v1.6-q4_0

34b-v1.6-q4_1

34b-v1.6-q4_K_M

34b-v1.6-q4_K_S

34b-v1.6-q5_0

34b-v1.6-q5_1

34b-v1.6-q5_K_M

34b-v1.6-q5_K_S

34b-v1.6-q6_K

34b-v1.6-q8_0

7b-v1.5-fp16

7b-v1.5-q2_K

7b-v1.5-q3_K_L

7b-v1.5-q3_K_M

7b-v1.5-q3_K_S

7b-v1.5-q4_0

7b-v1.5-q4_1

7b-v1.5-q4_K_M

7b-v1.5-q4_K_S

7b-v1.5-q5_0

7b-v1.5-q5_1

7b-v1.5-q5_K_M

7b-v1.5-q5_K_S

7b-v1.5-q6_K

7b-v1.5-q8_0

7b-v1.6

7b-v1.6-mistral-fp16

7b-v1.6-mistral-q2_K

7b-v1.6-mistral-q3_K_L

7b-v1.6-mistral-q3_K_M

7b-v1.6-mistral-q3_K_S

7b-v1.6-mistral-q4_0

7b-v1.6-mistral-q4_1

7b-v1.6-mistral-q4_K_M

7b-v1.6-mistral-q4_K_S

7b-v1.6-mistral-q5_0

7b-v1.6-mistral-q5_1

7b-v1.6-mistral-q5_K_M

7b-v1.6-mistral-q5_K_S

7b-v1.6-mistral-q6_K

7b-v1.6-mistral-q8_0

7b-v1.6-vicuna-fp16

7b-v1.6-vicuna-q2_K

7b-v1.6-vicuna-q3_K_L

7b-v1.6-vicuna-q3_K_M

7b-v1.6-vicuna-q3_K_S

7b-v1.6-vicuna-q4_0

7b-v1.6-vicuna-q4_1

7b-v1.6-vicuna-q4_K_M

7b-v1.6-vicuna-q4_K_S

7b-v1.6-vicuna-q5_0

7b-v1.6-vicuna-q5_1

7b-v1.6-vicuna-q5_K_M

7b-v1.6-vicuna-q5_K_S

7b-v1.6-vicuna-q6_K

7b-v1.6-vicuna-q8_0

v1.6

Size

4.7GB

8.0GB

20GB

27GB

6.1GB

7.6GB

7.0GB

6.3GB

8.0GB

8.8GB

8.5GB

8.1GB

9.6GB

10GB

9.9GB

9.6GB

11GB

14GB

8.0GB

27GB

5.5GB

7.6GB

7.0GB

6.3GB

8.0GB

8.8GB

8.5GB

8.1GB

9.6GB

10GB

9.9GB

9.6GB

11GB

14GB

20GB

69GB

14GB

19GB

17GB

16GB

20GB

22GB

21GB

20GB

24GB

27GB

25GB

24GB

29GB

37GB

14GB

3.5GB

4.2GB

3.9GB

3.6GB

4.5GB

4.9GB

4.7GB

4.5GB

5.3GB

5.7GB

5.4GB

5.3GB

6.2GB

7.8GB

4.7GB

15GB

3.3GB

4.4GB

4.1GB

3.8GB

4.7GB

5.2GB

5.0GB

4.8GB

5.6GB

6.1GB

5.8GB

5.6GB

6.6GB

8.3GB

14GB

3.2GB

4.2GB

3.9GB

3.6GB

4.5GB

4.9GB

4.7GB

4.5GB

5.3GB

5.7GB

5.4GB

5.3GB

6.2GB

7.8GB

4.7GB


关键词

多模态 视觉理解 对话系统

分类

人工智能 图像处理 自然语言处理
正文到此结束
本文目录