🚀 OpenClaw AI 导航已收录 30+ 款全球 AI 模型 · Pro 会员限时 8 折 · 需求大厅接单赚钱

🔮

GPT-4o Vision

OpenAI · 多模态

🔗 访问官网

📝 简介

GPT-4o的视觉理解能力，可分析图片、截图、文档，理解复杂视觉内容。

✨ 核心特性

✓图像理解

✓OCR

✓图表分析

✓文档解析

✓视频理解

💰 定价信息

计费模式按量计费

输入价格¥17.5 / 百万tokens

输出价格¥70 / 百万tokens

📊 性能评分

速度

8

质量

9

4.7

★★★★

890 条评测

综合评分基于用户反馈和各项性能指标

🏷️ 标签

视觉理解 OCR 多模态

📋 详细信息

厂商OpenAI

分类多模态

发布日期2024-05-01

最近更新2025-01-01

支持语言多语言

上下文窗口—

🔗 同类模型

通义千问-VL Max

通义千问多模态版本，支持图像和视频理解，中文场景表现优异。

★ 4.4·345 评测

Gemini Pro Vision

Google多模态大模型，支持图像理解、视频分析和图文混合推理。

★ 4.6·892 评测

Claude 3 Vision

Anthropic多模态模型，擅长复杂图像分析和图文结合推理任务。

★ 4.7·1023 评测

智谱AI多模态大模型，支持图像理解、视觉问答和图文创作。

★ 4.4·567 评测

百度文心一格VL

百度文心系列多模态模型，支持图像理解与中文视觉问答。

★ 4.2·412 评测

开源多模态大语言模型，将视觉编码器与LLM结合实现视觉推理。

★ 4.3·678 评测

💬 用户评测 (0)

📝

暂无评测，成为第一个分享使用体验的人吧！

❤️

觉得有用？支持一下作者

广告 · 智谱AI推广

⚡ 智谱AI GLM-4 Plus

中文最强模型，新用户赠送100万tokens

📤 分享