A股大模型再添重磅玩家 未来主战场在场景应用端?
《科创板日报》5月8日讯(编辑 郑远方)“三项能力超过ChatGPT”、“10月24日将整体超过GPT水平”,5月6日,科大讯飞星火认知大模型发布会现场,董事长刘庆峰放出豪言,为如火如荼的“大模型之战”又添了一把火。
【资料图】
这一大模型也在现场实时展示了多项能力,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态输入与表达等。
星火认知大模型目前已对外开放测试。刘庆峰透露,6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。
同时,基于星火认知大模型,科大讯飞也针对教育、办公、汽车和数字员工领域发布相关产品:
1)教育:赋能AI学习机产品,支持AI作文批改和口语对话测评;
2)办公:赋能智能办公本、录音笔、讯飞听见等产品,支持文本摘要生成、口语转书面语;
3)汽车:支持车内跨场景、跨业务人机交互;
4)数字员工:虚拟人技术可用于客服场景。
而就在5月5日,好未来也宣布,学而思正在研发数学大模型MathGPT,其面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心打造而成。目前,该AI数学大模型已取得阶段性成果,将于年内推出基于该自研大模型的产品级应用。
再向前回溯,百度文心大模型、阿里巴巴通义大模型、华为盘古大模型、腾讯混元大模型等也已相继发布。
可以看到,相较于之前百度等公司的大模型,科大讯飞的星火大模型与学而思MathGPT都更为聚焦于细分领域应用。
海外也已有多项实例。例如医疗领域中,微软子公司Nuance推出基于GPT-4的DAXExpress,可根据对话起草临床笔记,减轻护理人员负担;微软还将探索AI在医学多模态模型、解码免疫系统等领域的应用。工业领域中西门子与微软合作,利用生成式AI辅助工厂自动化软件中代码的创建、优化和调试,提升产品设计和制造过程的效率和创意。
大模型的迭代,为AI应用奠定基础,而插件的应用,也进一步拓宽了大模型的能力边界。开源证券总结认为,AI应用包括两大方向,一是通过提供AI功能带来的额外价值量(提升订阅用户数或ARPU值),二是通过AI赋能帮助客户实现降本增效。无论是C端还是B端,生成式AI都有广阔应用前景。
百度创始人、董事长兼CEO李彦宏日前更指出,在真正的AI时代,新的应用会基于大模型来开发,就像十几年前各种基于安卓、iOS的应用大量涌现一样。大模型是Game Changer,它会彻底改变云计算的游戏规则。“未来,我们要有意识地培养AI原生应用的思维方式和理念,要用新的理念去重构现在的每一个产品和业务。”
那么,大模型又将如何赋能应用?
券商认为,大模型“预训练+精调”即可对下游应用赋能。大模型优化人类与机器交互方式,是效率的革命。大模型是“大数据+大算力+强算法”结合的产物,对比国内外大模型,算力储备上国内并无短板;算法上OpenAI有先发优势;前期数据的丰富度和量对大模型的训练至关重要。
国信证券指出,国内成熟大模型落地具备较好的条件,业内已有相对成熟的方法路径(Transformer等)、大模型(GPT2、Meta-LLaMA等)及相关数据基础,而芯片短期看并未成为发展限制。预计国内GPT3级模型或在不久的将来出现,对国内产业链形成巨大影响。
进一步地,分析师认为,应用场景环节上,有以下禀赋的企业:①原有产品场景壁垒高,且受益于AIGC出色的信息获取、内容生成能力;②有独特垂直的高质量数据;③有用户粘性与深度;④本身有较强的AI技术研发与落地能力;加持自有大模型或外部模型API有望上台阶,关注腾讯、阿里、百度,以及游戏、金融、教育、办公等垂直领域有高质量数据与场景的优质企业。反之,如无上述禀赋,或面临被大模型降维竞争风险。
关键词: