周鸿祎谈“百模大战”:弯道超车的关键在发展多模态

本文来源:时代周报 作者:唐洛

“作为搜索引擎厂商,我们发展大模型不该是等到ChatGPT火了才跟进。”6月13日,在三六零(601360.SH,以下称“360”)智脑大模型发布会现场,创始人周鸿祎在谈到大模型行业时说道。


【资料图】

周鸿祎继续称,包括360在内的搜索引擎公司,都应该抽自己耳光,因为早在多年前就开始发展大模型,但只顾解决眼前问题,忙着做场景结合,“如果那个时候有员工提出要做通用型人工智能,我想无论是周总、李总还是马总,给出的答案都是:滚一边去。”在他看来,应该感谢OpenAI的执着,给整个AI行业指明了正确的方向。

对于国内大模型和国际上的差距,周鸿祎也表达了信心。“原先我曾说国内大模型和国际差距有一两年,现在我收回这句话,中国大模型的发展速度已经基本赶上国际先进水平,整体的基本水平已经赶上GPT-3.5,追赶GPT-4的速度也超过自己的想象。”

周鸿祎提到,今年年初,在ChatGPT发布后,中国已经进入百模大战,各家企业都发布了自己的大模型产品,这三个月相当于人工智能行业过去的三十年。

在这场发布会上,周鸿祎把下半场的重点放在了360智脑大模型的多模态能力和应用场景上。360AI数字人背后是“360智脑4.0”,提供多模态能力支撑。周鸿祎表示,GPT时代中国自研大模型弯道超车的关键在于发展多模态。

国内首发“文生视频”多模态能力

当天,360发布了旗下“360智脑大模型”的4.0版本。周鸿祎表示,4.0版本有三个关键词:多模态、全端应用、数字人。

周鸿祎介绍,认知型通用大模型“360智脑4.0”具备生成与创作、多轮对话、代码能力、逻辑与推理、知识问答、阅读理解、文本分类、翻译、文本改写、多模态(文本生成图像)十大核心能力。这十大核心能力已通过中国信通院“可信AIGC大语言模型基础能力”评估。360智脑是国内首个通过中国信通院该项权威评估的大模型产品。

“OpenAI的ChatGPT最先体现出强大的文字生成能力,中国企业追赶GPT大模型的速度很快,目前各家企业在文字生成方面的能力已经实现国际领先。预计GPT-5全面支持多模态能力,中国自研大模型弯道超车的关键在于发展多模态能力。”周鸿祎称,在多模态方面,360已具备跨模态生成能力,包括文生文、文生图、文生表、图生图、图生文、视频理解等功能。

他进一步解释,多模态能力是给大模型增加上眼睛、耳朵、鼻子、嘴巴,而不仅仅只有大脑。下一步,360计划将360智脑升级到5.0版本,并发布插件平台,安装上插件是要让它有手和脚的能力,这样大模型的能力才能发挥出来。“当大语言模型有了多模态能力之后,它获得的知识就不仅仅来自于文字的知识,可以来自于图片,来自于视频。”周鸿祎说。

值得注意的是,360此次还发布了“文生视频”的功能,可以使用任何文字脚本生成视频,这也是国内大模型厂商首次发布此类功能。周鸿祎在现场实时演示了360智脑是如何做出一段“无中生有”的视频,他用文字指令要求360智脑生成熊猫划船、企鹅在沙漠中洗澡的视频,就在几秒之后,就生成了一段颇为真实的视频。

AI数字人也是360本次重点发布的新产品。在发布会现场,周鸿祎与诸葛亮、孙悟空、马斯克等数字人开展实时对话问答。

其中,周鸿祎询问了“马斯克”关于“中国电动车产业是否对你构成威胁”、“如何评价推特公司”“火箭发射失败,对你是否是重大打击”等问题。

目前,360的AI数字人拥有200多个角色,分为数字名人和数字员工两类。数字名人包括历史人物、偶像明星、文学形象等,让用户在与数字人的开放对话中实现与偶像的近距离接触,与先贤的思想交流。数字员工则可成为企业员⼯的知识助⼿和办公助手,提升企业运营效能。

此外,AI数字人还支持定制,生成自己的专属数字人。周鸿祎在现场创建了自己的数字人,作为360的发言人,“说对了算我的,说错了算他的。”

在周鸿祎看来,在未来的人工智能大模型的应用环节,数字人将成为人机对话的全新入口,“区别于传统数字人只能按既定脚本输出内容,360AI数字人的特点在于有记忆、有人设和性格,能够复刻思维方式和人生经历,是有灵魂的数字人。”

“我希望有一天当我要讨论一个新产品的时候,我能跟马斯克、乔布斯、诸葛亮的数字人坐在一起,让大家对我的产品提一些建议。设想一下,如果有多个数字人,有不同的人设,不同的经历,背后都是人工智能在驱动,让他们一起来帮你做脑力激荡,一起来跟你完成共同的目标。”周鸿祎觉得,这是智脑一个更大的提升,也是360提出的“one more thing”。

“百模大战”

当下,人工智能领域鲜花着锦,诸多大模型争相问世,如京东chatJD大模型、百度文心大模型、阿里通义大模型等。科技部新一代人工智能发展研究中心日前发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个。

但各家都有自己擅长的领域,成熟的业务矩阵,且都是先拿自家的业务当做“试金石”,呈现的结果自然不同。比如阿里云将通义千问接入办公软件“钉钉”,可自动生成群聊摘要、辅助内容创作、总结会议纪要;百度的文心一言,将B端“生态圈”作为宣传和业务重点;华为云盘古大模型提出了“AI for Industries”理念。

360智脑则是融合多模态能力,试图做出一个真正的AI数字人。周鸿祎认为,多模态是360智脑在“百模大战”中突围的重要路径。

在他看来,百度、腾讯、头条、阿里、360都会在自己的固有场景里把自己的AI能力赋能。接下来真正比拼的是应用落地的能力,要思考如何让个人和企业更方便、简单地使用AI大模型应用。“大模型的价值不仅仅在于互联网场景,而是把大模型能力通用化、泛化、垂直化,和不同行业、不同企业具体的业务需求深度地融合。这样的产业机会实际上才刚刚开始,未来至少有10年的红利时期。”周鸿祎说。

目前,360智脑4.0版本已接入360全端产品,包括搜索、360浏览器、360安全卫士等。随着大模型开放内测、应用场景的逐步落地,AI赋能的或许远不只是产品本身。

“人工智能的理念还是应该以人为本。我们无论做出多么强大的人工智能,都是在为人类做有史以来最好的工具。通过工具的赋能,让个人、公司、机构都能真正地提高劳动生产率。”周鸿祎觉得,大模型应该成为人类的朋友和助手。

关键词: