当前位置:动态

度小满开源国内首个千亿参数金融大模型“轩辕”

2023-05-26 19:31:27 来源:ZAKER科技


(资料图片)

近日 , 度小满正式开源国内首个千亿级中文金融大模型—— " 轩辕 "。轩辕大模型是在 1760 亿参数的 Bloom 大模型基础上训练而来 , 在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上 , 效果相较于通用大模型大幅提升 , 表现出明显的金融领域优势。

近日 , 度小满正式开源国内首个千亿级中文金融大模型—— " 轩辕 "。轩辕大模型是在 1760 亿参数的 Bloom 大模型基础上训练而来 , 在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上 , 效果相较于通用大模型大幅提升 , 表现出明显的金融领域优势。

在金融场景中的任务评测中 , 轩辕全面超越了市场上的主流开源大模型 , 赢得了 150 次回答中 63.33% 的胜率 , 充分凸显了其在金融领域的显著优势。在通用能力评测中 , 轩辕有 10.2% 的任务表现超越 ChatGPT 3.5,61.22% 的任务表现与之持平 , 涉及数学计算、场景写作、逻辑推理、文本摘要等 13 个主要维度。

为了提升轩辕大模型对金融领域问题的理解能力 , 度小满将自身业务中积累的金融领域的千亿 tokens 的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示 , 经过清洗和标注的高质量数据集 , 不仅在通用性方面与 ChatGPT 达到持平成为可能 , 且显著提升了模型在金融垂直领域的性能。

BLOOM ( Big Science Language Open-science Open-access Multilingual ) 是 2021 年由 1000 多名志愿研究人员在一个名为 " 大科学 BigScience" 的项目中创建 ,2022 年 7 月 12 日正式发布。BLOOM 拥有 1760 亿个参数 ( 决定输入数据如何转换为输出内容的变量 ) , 稍多于拥有 1750 亿个参数的 GPT-3。BLOOM 拥有 1.61TB 文本 , 包含 46 种自然语言和 13 种编程语言。相比 Meta 发布的 130 亿参数的 LLaMA ( Large Language Model Meta AI ) 模型 ,Bloom 参数量更占优势。

目前 , 千亿级的轩辕模型已可以在 Huggingface 中申请下载 , 面向所有金融机构开放。 下载地址 :https://github.com/Duxiaoman-DI/XuanYuan

度小满 CTO 许冬亮表示 , 轩辕大模型是经度小满业务场景中积累的金融数据训练而来的 , 对金融相关问题的理解比通用大模型更有优势。我们把大模型能力开放给金融机构 , 有利于推动大模型在金融行业的应用 , 降低大模型的应用门槛 , 提升金融行业智能化水平。

作为 AI 新基建 , 大模型在金融及各个行业有着广泛的应用场景。轩辕大模型开源后 , 对金融机构有何意义 ?

许冬亮认为 , 生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力 , 在金融场景中会有广泛的应用。在前台 , 生成式大模型将大幅提升客户经理的专业水平和服务能力 , 大幅降低客户经理的运营成本 , 让每个人都拥有 24 小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台 , 生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式 , 进而大幅提升企业内部办公效率 , 甚至引发研发测试模式变革 , 全方位的提升金融企业内部运营效率。在后台 , 大模型将成为智能科技底座的标配 , 大幅降低智能技术应用的门槛 , 只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。

度小满依托于百度人工智能技术 , 已经开展了一系列基于大模型的应用。以风险管理为例 , 度小满已经将大型语言模型 LLM 应用在互联网文本数据、征信报告的解读上 , 通过用文本数据构造的预训练模型以及 AI 算法 , 能够将征信报告解读出 40 万维的风险变量 , 更好的识别小微企业主的信贷风险。今年 5 月份 , 这一工程荣获了 " 吴文俊人工智能科学技术奖 "。今年 2 月份 , 百度基于文心大模型技术推出的生成式对话产品 " 文心一言 " ( 英文名 :ERNIE Bot ) 开放生态合作 , 度小满成为首家接入的金融科技公司。

关键词:


全球看热讯:学好中医经典的诀窍

2023-05-26

动态来源:中医彭鑫博士

教育