当前位置：首页 > 主站 > 综合

金融大模型评测体系2.0版在上海发布

时间：2025-12-29 10:11:22

　　近日，2025金融大模型评测体系在上海发布，这是去年全国首个金融大模型评测体系发布以来第一次全面升级至2.0版，主要聚焦标准引领、数据驱动、安全可信与生态共建四方面。

　　大模型评测体系通常是评估大模型的性能、安全性、可靠性等方面的指标、方法、基准和流程的集合。近年来，国内涌现出多个金融大模型，但行业内还缺少较为权威和被认可的评测体系。而2025金融大模型评测体系，相当于为行业提供了科学选型和与能力对标的重要“标尺”。

　　据介绍，该评测体系汇聚了4个公开数据集与22个自建数据集，约3.6万条评测数据，采用循环选项打乱机制和多样化提示词，并研发金融裁判大模型，实现评测全流程自动化、标准化，为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估，助力机构选型、优化及风险把控。

　　在最新的评测体系下，今年的金融大模型测试结果全面超越去年，行业平均71.9分提升到87.37分。同时，测试结果还发现，海内外大模型整体能力相差不大，但在中文领域，国内大模型处于领先水平。另外，国内金融大模型在语言理解、术语消歧、法规政策更新和合规对齐等领域领先，国外金融大模型则在数学计算、跨步推理、跨语言推理和超长文本处理上领先。

来源: 解放日报编辑: zr2022

免责声明：本文内容由用户注册发布，仅代表作者或来源网站个人观点，不构成任何投资建议，不代表本网站的观点和立场，与本网站无关。本网系信息发布平台，仅提供信息存储空间服务，其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。如因作品内容侵权需删除与其他问题需要同本网联系的，请尽快通过本网的邮箱或电话联系。

财经
金融
科技
汽车
教育
旅游

济南、青岛等9个市被授予第三届山

金融大模型评测体系2.0版在上海发布

家财险进家门还有几道坎

国华人寿放弃30亿次级债赎回权，险企“不赎回”背后原

“5G+工业互联网”迈向深度融合

购置税新规“倒计时”　车企抢抓市场窗口期

让健康成为学校发展的“硬指标”

冰雪游于“有”中求“优”

最新资讯

新闻排行

热点图片

金融大模型评测体系2.0版在上海发布

家财险进家门还有几道坎

国华人寿放弃30亿次级债赎回权，险企“不赎回”背后原

“5G+工业互联网”迈向深度融合

购置税新规“倒计时” 车企抢抓市场窗口期

让健康成为学校发展的“硬指标”

冰雪游于“有”中求“优”

最新资讯

新闻排行

热点图片

购置税新规“倒计时”　车企抢抓市场窗口期