🚀 OpenClaw AI 导航已收录 30+ 款全球 AI 模型 · Pro 会员限时 8 折 · 需求大厅接单赚钱

🔮

LLaVA

开源社区 · 多模态

🆓 有免费额度🔗 访问官网

📝 简介

开源多模态大语言模型，将视觉编码器与LLM结合实现视觉推理。

✨ 核心特性

✓开源模型

✓视觉推理

✓指令跟随

✓可本地部署

💰 定价信息

计费模式完全免费

免费额度完全免费开源

📊 性能评分

速度

7

质量

7

4.3

★★★★

678 条评测

综合评分基于用户反馈和各项性能指标

🏷️ 标签

多模态开源 LLaVA

📋 详细信息

厂商开源社区

分类多模态

发布日期2023-04-01

最近更新2025-03-01

支持语言英文

上下文窗口4K tokens

🔗 同类模型

GPT-4o的视觉理解能力，可分析图片、截图、文档，理解复杂视觉内容。

★ 4.7·890 评测

通义千问-VL Max

通义千问多模态版本，支持图像和视频理解，中文场景表现优异。

★ 4.4·345 评测

Gemini Pro Vision

Google多模态大模型，支持图像理解、视频分析和图文混合推理。

★ 4.6·892 评测

Claude 3 Vision

Anthropic多模态模型，擅长复杂图像分析和图文结合推理任务。

★ 4.7·1023 评测

智谱AI多模态大模型，支持图像理解、视觉问答和图文创作。

★ 4.4·567 评测

百度文心一格VL

百度文心系列多模态模型，支持图像理解与中文视觉问答。

★ 4.2·412 评测

💬 用户评测 (0)

📝

暂无评测，成为第一个分享使用体验的人吧！

❤️

觉得有用？支持一下作者

广告 · 智谱AI推广

⚡ 智谱AI GLM-4 Plus

中文最强模型，新用户赠送100万tokens

📤 分享