(相关资料图)
2023年9月8日,蚂蚁集团在2023外滩大会上宣布发布金融大模型,并开源生成式AI编程平台CodeFuse。蚂蚁集团首席技术官、平台技术事业群总裁何征宇在接受采访时介绍,蚂蚁大模型走纯自研的技术路线,以全栈布局、长线发展为原则,以创造产业价值为目标。为此,蚂蚁集团坚决投入大模型底层基础设施,目前已建成万卡AI集群,训练效率领先行业,为大模型产业化应用提供有力支撑。何征宇介绍,蚂蚁集团一直以来坚持核心技术自主创新,2022年底正式立项大模型研发,目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。今天发布的蚂蚁金融大模型基于蚂蚁基础大模型,针对金融产业深度定制。蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比90%以上,RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍,推理性能相较于业界方案提升约2倍,处于业界先进水平。何征宇表示,未来蚂蚁集团将持续探索和精进大模型的五大能力方向:一是建设高质量的数据标注团队,沉淀高质量数据体系;二是攻坚基础大模型算法,以及高效绿色工程能力,提升模型逻辑推理等能力;三是从通用语言大模型到通用多模态大模型,从一般通识走向全面专业;四是建设高效的大模型评测标准和评测体系,加快大模型迭代速度;五是建设大模型安全能力,保障大模型健康可持续发展。
关键词: