🚀 OpenClaw AI 导航已收录 30+ 款全球 AI 模型 · Pro 会员限时 8 折 · 需求大厅接单赚钱

🔮

Gemini Pro Vision

Google · 多模态

🆓 有免费额度🔗 访问官网

📝 简介

Google多模态大模型，支持图像理解、视频分析和图文混合推理。

✨ 核心特性

✓图像理解

✓视频分析

✓图文推理

✓多语言支持

💰 定价信息

计费模式按量计费

免费额度有限免费调用

📊 性能评分

速度

8

质量

9

4.6

★★★★

892 条评测

综合评分基于用户反馈和各项性能指标

🏷️ 标签

多模态 Google 视觉理解

📋 详细信息

厂商Google

分类多模态

发布日期2023-12-06

最近更新2025-03-01

支持语言英文、中文、多语言

上下文窗口32K tokens

🔗 同类模型

GPT-4o的视觉理解能力，可分析图片、截图、文档，理解复杂视觉内容。

★ 4.7·890 评测

通义千问-VL Max

通义千问多模态版本，支持图像和视频理解，中文场景表现优异。

★ 4.4·345 评测

Claude 3 Vision

Anthropic多模态模型，擅长复杂图像分析和图文结合推理任务。

★ 4.7·1023 评测

智谱AI多模态大模型，支持图像理解、视觉问答和图文创作。

★ 4.4·567 评测

百度文心一格VL

百度文心系列多模态模型，支持图像理解与中文视觉问答。

★ 4.2·412 评测

开源多模态大语言模型，将视觉编码器与LLM结合实现视觉推理。

★ 4.3·678 评测

💬 用户评测 (0)

📝

暂无评测，成为第一个分享使用体验的人吧！

❤️

觉得有用？支持一下作者

广告 · 智谱AI推广

⚡ 智谱AI GLM-4 Plus

中文最强模型，新用户赠送100万tokens

📤 分享