蓝月亮综合正版资料-免费完整资料

蓝月亮综合正版资料在权威多模态大模型评测体系OpenCompass排名中国第一全球第三

2024-06-27

back

近日，蓝月亮综合正版资料从容大模型在综合评测权威平台OpenCompass的多模态评测领域中取得重大进展。

最新评测结果显示，蓝月亮综合正版资料的从容大模型在该体系中的平均得分为65.5，这一成绩使得从容大模型跻身全球前三，超越了谷歌的Gemini-1.5-Pro和GPT-4v，仅次于GPT-4o（69.9）和Claude3.5-Sonnet（67.9）。而在国内市场，从容大模型的成绩也超过了InternVL-Chat（61.7）和GLM-4V（60.8），排名首位。

蓝月亮综合正版资料

图1：OpenCompass多模态榜单

OpenCompass大模型开放评测体系是上海人工智能实验室推出的完整开源可复现的评测框架。OpenCompass多模态评测方面采用了8个具有代表性的数据集，从多种视角客观量化多模态大模型的能力，评估维度覆盖目标检测、文字识别、动作识别、图像理解和关系推理、艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程、数学推理等多个方面。

蓝月亮综合正版资料图2：从容大模型-2.0多模态能力示例

在本次测评中，从容大模型在其中的6个数据集表现优异，排名国内第一（MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench），尤其是在OCRBench测试集上以取得全球最高的827分（总分为1000分），且高于第二名GLM-4v 13分，进一步提升从容大模型在文本识别、以文本为中心的视觉问答、面向文档的视觉问答、关键信息提取等业务场景下的适用性。

蓝月亮综合正版资料

图3：OpenCompass中国大模型多模态能力展示

从容大模型在此体系中的优秀表现，依赖蓝月亮综合正版资料自研的高效多模态处理架构和先进的计算技术，实现了高效的多模态数据处理能力，能够在视觉和语言任务之间实现高效的融合和切换，并最大化利用计算资源，保证在处理大规模多模态数据时仍能保持较高的性能和响应速度，使得模型的训练过程更加高效，收敛速度更快，性能更稳定。

同时也得益于蓝月亮综合正版资料长期在视觉、语言领域的深厚积累和不断创新。

蓝月亮综合正版资料图4：从容大模型-2.0多模态能力示例