- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
金融大模型应用评测报告
摘要版
(2024)
上海人工智能实验室
上海财经大学
上海库帕思科技有限公司
二零二四年十二月
前言
为进一步推动金融科技创新应用的落地,切实提升金
融服务的智能化水平,降低企业数字化转型成本,并积极
探索金融垂直领域大模型应用的新理念、新机制和新手段,
上海人工智能实验室和上海财经大学根据上海人工智能协
会和上海金融业联合会共同发布的《金融大模型应用评测
T/SAIAS019—2024
指南》()团标,采用上海库帕思科技
有限公司依照上述团标制定的评测数据集《库帕思金融大
2024
模型评测数据集(版)》,形成了《金融大模型应用评
2024
测报告()》。
目录
一、金融大模型应用评测范式1
(一)评测对象范围1
(二)评测内容与方法4
(三)评测数据集5
(四)评测工具6
(五)综合评估分数7
二、金融大模型应用评测结果8
三、金融大模型应用评测总结11
说明14
金融大模型应用评测报告2024(摘要版)
一、金融大模型应用评测范式
(一)评测对象范围
本次测评对象包括国内外、开闭源、通用基模与金融垂
模,共计14个主流大模型机构的20个模型。评测围绕金融
行业的核心业务需求及大模型在金融场景中的适配性,结合
银行、证券、保险、基金等重点应用场景,形成“模型基础能
力”、“金融安全与价值对齐能力”、“金融风险控制能力”、“金
融专业认知能力”、“金融业务辅助拓展能力”5大测评维度。
具体详情参见表1-1。
表1-1参评模型清单
机构模型类型简介
OpenAIGPT-4o基模GPT-4oOpenAI推出的高
(多模态)级多模态模型,能够接受包括文本、
音频、图片和视频在内的任意组合输
入,生成文本、音频和图片的任意组
合输出。与现有模型相比,
GPT-4o在视觉和音频理解
方面表现尤其出色。
AnthropicClaude-3.5-Sonnet基模Claude-3.5-Sonnet是
(多模态)Anthropic发布的升级版,在推理、编
码和数学能力方面表现尤其出色。
谷歌Gemini-1.5-pro基模Gemini-1.5-pro是GoogleDeepMind发
(多模态)布的强大多模态模型,可处理各种推
理任务。Gemini-1.5-pro可以一次处理
大量数据,包括2小时的视频、19小
您可能关注的文档
最近下载
- 高考英语3500词汇(含音标).pdf VIP
- 《自动喷水灭火系统施工及验收规范》GB50261-2017.docx VIP
- -QB-GST200气体灭火控制器说明书.doc
- 《自动喷水灭火系统设计规范》 GB 50084-2017.pdf VIP
- GB50974-2014 消防给水及消火栓系统技术规范.docx VIP
- JB_T 5089.2-2020 内燃机 纸质滤芯机油滤清器 第2部分:滤芯 技术条件.docx VIP
- 湖南省怀化市2023年中考数学试题含答案解析 .pptx VIP
- 六年级上册语文试题期末测试题|学年 河北省保定市 冀教版(含答案).doc VIP
- GB 50300-2013建筑工程施工质量验收统一标准.pdf VIP
- 2023年湖南省怀化市中考模拟数学试题(含答案).docx VIP
文档评论(0)