本报记者 石飞月 北京报道
7月4日-7日,2024世界人工智能大会(WAIC)在上海世博中心及世博展览馆举办,智谱AI作为新一代AI独角兽企业自然不会缺席。展会期间,智谱AI展示了以智谱大模型开放平台bigmodel.cn与智谱大模型产品矩阵为核心的“智谱小镇”,并发布CodeGeeX第四代模型,旗下产品矩阵再添一员。
大模型的更新速度令人惊叹。有研究指出,大模型能力的增长速度已经远超震撼世人的摩尔定律,即便如此,理想中“AI解放人类生产力、人类关心诗与远方”的生活还远未实现,如今的现状是,AI是诗与远方,人类仍在做原来的工作。智谱AI CEO张鹏指出,AI创造的价值是指数级的,现在需要做的是突破大模型的多模态能力,才能真正放大它的价值。
多模态能力待突破
WAIC期间,智谱AI发布并开源代码生成大模型CodeGeeX的第四代产品 CodeGeeX4-ALL-9B,集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等所有能力于一体,号称是目前百亿参数以下性能最强、最全能的代码大模型。
智谱AI方面告诉《华夏时报》记者,目前CodeGeeX的个人用户数量已经超过100万,目前CodeGeeX对个⼈用户完全免费,在各种主流IDE均可免费下载使⽤。
CodeGeeX4-ALL-9B的诞生,让智谱AI的大模型产品矩阵更加丰富。在本次人工智能大会中,智谱AI就展示了以智谱大模型开放平台bigmodel.cn与智谱大模型产品矩阵为核心的“智谱小镇”。
据介绍,bigmodel.cn上部署着智谱大模型全家桶,包括具备视觉和智能体能力的GLM-4/4V;推理极速且高性价比的GLM-4-Air;基于文本描述创作图像的CogView-3、超拟人角色定制模型CharacterGLM、擅长中文的向量模型Embedding-2、代码模型CodeGeeX以及最新开源的GLM-4-9B等。
智谱AI脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,一开始就瞄准AI大模型研发落地。
作为新一代AI独角兽,智谱AI近两年的大模型更新速度不可谓不快,而这背后,是大模型能力迅猛的增长速度。不久前,来自 MIT FutureTech 的研究人员发表了关于大模型能力增速的研究,结果表明,LLM 的能力大约每 8 个月就会翻一倍,速度远超芯片的摩尔定律。
然而即便如此,当下大模型的能力仍旧满足不了人们对AI赋能工作与生活的理想场景。在张鹏看来,其中一个重要原因,就是大模型多模态的突破程度不够。“有些东西其实很难量化,比如人的逻辑性、抽象思考的能力,我们现在需要突破大模型的多模态,人在现实世界中解决问题的时候,需要输入的信息本身就是多模态的,除了自然语言以外还有视觉、听觉、触觉还有常识,所有这些需要综合起来才能解决现实世界当中很多常见的问题。”
再谈行业价格战
不久前,智谱AI大模型的两次降价,让该公司成为这波大模型“价格战”中最为冲锋陷阵的一员:5月11日,智谱AI第一次宣布降价,旗下的GLM-3 Turbo模型调用价格由5元/百万tokens调整为1元/百万tokens,GLM-3 Turbo Batch 批处理 API的价格为1元/200万tokens;6月5日,智谱AI又宣布新一代MaaS平台采用全新企业权益成长体系,以一种差异化方式实现降价。
这波降价潮还没结束,此次WAIC期间,百度智能云又宣布文心大模型4.0 Turbo(ERNIE 4.0 Turbo)面向企业客户全面开放,文心旗舰款模型ERNIE 4.0和ERNIE 3.5宣布大幅降价,同时百度智能云千帆大模型平台针对模型效果、推理性价比以及AI原生应用开发提效发布十余项能力升级。
张鹏再次回应了行业价格战,表示降价是因为技术驱动,技术越来越好,成本越来越低,价格才能持续走低,这个阶段用户是得益的。
但张鹏也强调,“降价一事不能过度,这是不长久的,它不符合正常的商业逻辑。真正的价值应该是逐级的,人们不断添加自己的价值,再放大、扩大这个价值,我们提供更优质的服务,让人们用服务创造更大的价值,相应的我们创造这一部分价值应该反向再传递回来,大家各自得到自己价值的部分,这是一个正常合理的市场价值链。”
国家地方共建人形机器人创新中心总经理许彬也谈到了这个问题,不过是从人形机器人产业的角度来分析的。他认为,目前人形机器人产业更关注大模型本身的质量、幻觉、可靠性以及大模型的体量,比如大模型的规模将来如果足够小,可以放在端侧、机器人的本体上,以便更好地实现对机器人的控制和决策。“至于价格,我相信通过不断落地、不断应用,它的价格一定会下来,各个行业都是这样的,价格永远都是往下走,只是走的速度和幅度不同。”
具身智能是实现通用人工智能的有效途径,在这次WAIC期间,来自达闼、复旦大学、傅利叶、杭州宇树科技、开普勒等不同企业和高校的18台人形机器人组成“十八金刚”人形机器人阵列,在展馆大厅内颇为壮观。
从ChatGPT爆火至今,已经过去一年多的时间,随着入局者增多,行业探索愈加深入,行业应用更加广泛,整个人工智能大模型行业已经发生了明显变化,国内大模型产业也有了进步。
张鹏十分肯定大模型产业发展对实体经济的意义。他表示,在过去AI泛用性不够且成本太高,但大模型带来了一个新的机遇,它能够在一个模型上提供泛用化能力,这也是用新一代大模型技术赋能实体经济的主要方向——把原来一个底座投入很大但是收益很小的结构,变成一个倒金字塔结构,真正放大它的价值。
而相较于去年,“今年人们已经从关注大模型本身转变为思考和讨论大模型创造价值、赋能产业、落地应用,行业已形成共识,不再去讨论大模型是不是必要,或者大模型好还是小模型好,行业已经转变成更务实的状态。” 张鹏总结道。
责任编辑:黄兴利 主编:寒丰