云从科技大模型之路:昇思“黑土地”上的生态炼成记 最新
文 | 智能相对论
作者 | 李永华
一线客户经理,为客户一键生成周全的资产配置建议;
(资料图片仅供参考)
中端管理人员,获得系统自动撰写的一整套数据分析报表,快速、准确授信;
金融市场的“操盘手”,能够实时获取那些影响市场走势的舆情分析;
……
这些,是金融大模型落地后,预期将给行业带来的巨大改变——工作效率大大提升、工作成果质量得到切实保障。
这样的大模型,目前市面上已经有很多厂商在积极开发。
人工智能科技企业云从科技就是其中之一。
一个月前,云从科技正式发布大模型 “从容”,“从容”将以更好的交互性能,应用于金融、政务、交通、能源、教育、医疗、文娱等行业领域,其中金融等赛道将是重点布局的方向。
大模型浪潮下,像云从科技这样在AI领域有深厚积累的厂商,正在实现大模型的快速内测、公测、面向产业垂直场景落地。
而云从科技能够快速布局、出成果,除了自身在AI技术方面的积淀,还依托于全场景AI框架昇思MindSpore的开放生态。
以开放的姿态帮助有志于大模型的开发者、厂商实现大模型创新,昇思的玩法与云从科技的成功,让当下全球大模型创新之路更明晰——“黑土地”模式正在加速促进大模型的繁荣。
AI框架价值凸显,大模型走入“黑土地”生态繁育模式
在大模型的开发过程中,AI框架在基础硬件层面对接多样化的算力,在模型、应用层面做到能力支撑(本身也被行业定义为AI“操作系统”)。在当前,业界急切地关心一个个大模型的能力与效果如何,在技术方面最多看看参数量、计算成本等,而暂时没有将目光放到大模型开发过程中的各种基础软件技术支撑上,导致AI框架价值没有出现在普遍的业界视野当中。
就在最近,人工智能框架生态峰会2023在上海举办,500家伙伴、行业客户、高校、研究机构等代表参会,围绕AI框架如何与大模型有效融合推动大模型场景应用,进行了系列交流和探讨。
在峰会上,18家AI头部企业、高校、科研机构、开源社区等共同发布了“共建人工智能框架生态,繁荣中国人工智能产业”联合倡议,要共同努力推动AI框架生态发展、推动大模型发展。
作为中国AI框架的典型代表,昇思将以开放的姿态,支撑更多伙伴更好地开发与落地大模型。
以此为标志,可以认为大模型的“黑土地”时代正式来临。
何谓“黑土地”模式?
在其下,是坚实的地基——多样化的算力来源都可以兼容;
在其上,是可以自由生长的物种丛林,高矮胖瘦适合各种“审美”(场景需求)的物种都可以扎根、成长。
与此对应,“黑土地”之上,AI框架的优质伙伴厂商就成为重要的耕耘者,最终耕耘出一片大模型繁茂的生态。
而开篇提到的云从科技,就是昇思这片黑土地上的重要耕耘者之一。
将昇思能力引入其人机协同操作系统(CWOS)之上,云从科技正面向政府、企业以及消费者三个大致方向进行相关大模型的产品落地。
这背后,是云从科技自身禀赋与昇思能力的有效结合。
因为,要最终催生优质大模型成果,黑土地的品质、耕耘者的能力,都必不可少。
让昇思这片“黑土地”物尽其用,云从科技已齐集“耕耘者”必备的三大硬实力
“黑土地”模式下,耕耘者必须具备三大条件,才能培育出有价值的大模型成果。这些,正是云从科技的禀赋所在。
1、不是“平地起高楼”,而是已经具备AI创新的“基因”
大模型仍然是AI领域的延伸,这一大步要走的扎实,必须在AI领域已经跋涉多时。
那些出彩的大模型,包括国外的ChatGPT,国内的紫东.太初等,都基于过去长年的AI开发经验。
而云从科技,就是这样一个有深厚积淀的厂商。
2015年,云从科技从中科院孵化出来,拥有全链AI能力,已经在各种权威奖项中9次斩获人工智能世界冠军,且承建AI相关的三大国家平台,参与众多国家与行业标准制定。
2022年5月,云从科技完成科创板上市,成为科创板首家AI平台公司。
在国内,云从科技是较早的将预训练模型应用到具体项目中的企业,在大模型走向场景应用所需要的“下游任务精调”方面,有充分的技术储备和实践经验。
除了能力,在资源方面,云从科技还储备了数千张卡规模的算力资源,可同步满足3组基础大模型和10组行业大模型的训练和调优工作,未来还计划扩展到上万张卡——具备深厚的AI技术能力的云从科技,自己还打好了“地基”。
2、不是完全依赖外部经验输入,而是塑造了支撑大模型的“枝干”
在AI能力沉淀的基础上,云从科技还创新了一套适合自身能力特点的大模型“耕耘”方式。
云从科技对昇思的引入,建立在自家人机协同操作系统(CWOS)之上。
CWOS是一套从信息化到数字化再到智能化渐次递进的数字化架构,致力于让机器像人一样思考和工作,大致可以概况为三个层面:信息化阶段通过AIoT等获取各类数据,数字化阶段处理数据、转化知识,智能化阶段实现场景的各种应用,这其中包含有感知、认知、决策各领域的核心技术。
这使得CWOS与大模型天然亲和,后者可以作为智能化阶段的重要构成要素(未来可能是支柱型技术)。
早在今年1月,云从科技就对外宣布已经陆续在NLP、OCR、机器视觉、语音等多个领域开展预训练大模型的实践,其背景,就是CWOS可以无缝整合众多技术平台,快速入局大模型赛道。
自然,CWOS也能无缝接入昇思。
目前,云从科技与昇思联创了一套基于CWOS的方案:
这个由端(信息化,获取数据)、边(处理数据、转化知识)、云(智能化支撑场景应用)三重架构组成的联创自主方案,完整体现了CWOS一直以来的思维方式,将云从科技的能力与体系,与昇思进行了完整融合。
如此,CWOS便可以支撑更多行业平台和应用的通用化、智能化大脑,利用大模型能力发挥视觉、语音、NLP技术的优势。
3、不是盲目落地,而是有场景实践经验来保证“果实”生长
在落地阶段,大模型去赋能千行百业,往往需要在对应的行业、场景已经有相关的合作与实践。
首先,是直接的合作伙伴。
直白地说,要有行业代表性企业一起来推进,要有末端、有抓手、有路径。
云从科技历经长期与各垂直领域企业的紧密合作,在数字政府、金融、大交通、智能制造等领域,可以直接联合各行头部企业、机构打造不同的行业大模型,推动行业数智化建设。
然后,是数据与认知上的积累。
深入垂直行业的大模型,“大”可能不是关键,“专”才更重要,专有数据的运用,要赛过追求“绝对数据”。
云从科技采用的“专家知识”+“人工智能”大模型路线,在行业数据、专家知识等方面的深度储备,为行业大模型奠定了基础。
最后,是直接的应用探索。
云从科技的大模型,在智慧政务方面为市民提供出游建议,在传媒行业帮助提升数字人直播质量,在教育行业减轻教师任务工作量……这些都与其长期在这些行业的AI应用创新探索有直接的关系——只不过是更进一步将大模型能力融合其中。
开篇提到的金融行业大模型,同样是云从科技重点深耕的领域,为此,云从科技还专门进行了长期规划,要在2025年完成金融、智能制造、机场交通等领域通过大模型带来认知能力的跃迁,让人机协同能力更进一步。
“黑土地”够肥沃,大模型生态才能持续繁盛
从云从科技的案例中,可以发现厂商自身禀赋的重要性,但昇思与CWOS的协同同样是关键所在。
只有“黑土地”足够肥沃,才能支撑起一片繁茂的生态。
好在,敢于以开放、多元、包容姿态出现昇思,已经有充分的准备。
首先,在技术方面,昇思已经完成对大模型多方面的能力支撑。
在2020年的首版本中,昇思就在行业中率先推出了面向大模型自动并行特征。在持续的发展过程中,昇思一直致力于将大模型孵化过程中的系统工程难题集成到软件框架中解决。较为典型的,如昇思社区已经开源了15+个基础训练模型以及训练脚本(包括常用的BLOOM、LLAMA等)。
在最新的昇思2.0版本中,大模型全流程解决方案正式推出,拥有面向大模型的众多特性:脚本开发阶段实现极简易用,训练阶段实现硬件资源的高效利用,场景微调阶段实现低参微调算法的整合,部署阶段实现算力成本的节约,等等。
然后,在实践方面,已有“大树”级大模型被昇思这片黑土地所孕育。
实际上,在大模型火热的浪潮开启之前,昇思就已经支撑了很多知名行业大模型的发展,“黑土地”模式并不是现在才开始。
当前,基于昇思孵化的大模型数量已经超过20个。
例如,中科院研发的全模态大模型“紫东.太初2.0”,就拥有语音、图像、文本、视频、传感信号、3D点云等复杂模态识别能力。
已经啃下“硬骨头”的昇思,在帮助云从科技等企业时,就变得更底气。
最后,在软硬件协同方面,昇思还实现了大范围的兼容或适配。
目前,昇思面向端边云全场景开放,已适配了国内主流的AI芯片和硬件设备超过20款。
这使得“黑土地”可以敷设在大部分“地基”之上。
云从科技与昇思联创的大模型云平台(MaaS,用于赋能更多行业客户创造属于自己的大模型),其底层就利用到了Altas系列计算资源。
现在,474万的开源社区下载量,1.3万的社区贡献者,5500家服务企业数量,400多个开源模型,超900篇顶会论文,昇思自身的技术能力在积极的生态建设下,还在不断进化。
这片“黑土地”还在不断肥沃,更多类似云从科技这样的大模型耕耘者还将持续加入,共同繁育大模型生态。
*本文图片均来源于网络
关键词: