本报(chinatimes.net.cn)记者卢晓 北京报道
从为自己点一杯咖啡到让客户快递顺利下单,作为AI应用的一个重要方向,智能体不仅日渐渗透进人们的日常生活,也越来越多地出现在工作场景中。
5月21日,腾讯宣布腾讯云大模型知识引擎全面升级为“腾讯云智能体开发平台”。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生当天还表示,随着AI的持续落地,每个企业都将成为AI公司;每个人都将是AI加持的“超级个体”。
在这背后,面向B端市场的智能体已经成为大模型厂商们的竞争焦点。他们现在比拼的是谁能帮助庞大的中小企业们更快地建立起更好用的智能体,为他们增加更多的“虚拟好员工”。
加码B端市场
据腾讯方面介绍,腾讯云智能体开发平台首次实现了零代码支持多智能体的转交协同方式,进一步降低了智能体搭建的门槛。而面向确定性比较高的执行流程,用户也可以采用工作流模式,拖拉拽各种原子能力,让智能体基于固定流程运行,得到更确定性的结果。
“腾讯云智能体开发平台的定位是为客户搭建更强大、更复杂的智能体应用。”5月21日,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声在接受《华夏时报》等媒体记者采访时这样说。
他认为,在 ToB 场景下,Agent的本质是一种新的应用形态。它和传统软件最核心的区别在于,它具备自主规划能力,可以根据用户的自然语言指令,自主调用工具,甚至多个 Agent 协同完成一个复杂任务。这种范式和过去软件预设流程有本质不同。
需要提及的是,据记者了解,腾讯混元大模型团队此前已经推出过智能体开放平台“元器”。吴运声当天对本报记者表示,这两者是面向不同用户群的产品形态,“元器”偏C端,主要是跟“元宝”结合,用来为个人用户或轻量开发者提供智能体定制能力,而“腾讯云智能体开发平台”则是面向B端的企业级平台。
在推出智能体平台背后,腾讯大模型正在迅速迭代和开源。据记者了解,早在去年下半年,腾讯就大力投入了深度思考模型的路线攻关,混元T1自年初上线元宝App后,持续快速迭代。基于混元TurboS基座,腾讯新推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice,近期还将推出实时视频通话AI体验。
腾讯云副总裁、腾讯混元大模型技术负责人王迪还介绍,目前混元已实现图像、视频、3D、文本等在内的全模态开源,未来将推出多尺寸混合推理模型,从0.5B到32B的dense模型,以及激活13B的MoE模型,适配企业与端侧需求。混元图像、视频、3D等多模态基础模型及配套插件模型也将持续开源。
智能体竞赛打响
随着智能体逐渐在汽车、 金融、 文旅 、消费电子、医药连锁、零售等行业落地,大模型厂商围绕智能体的发力早已开始。
今年4月,阿里云百炼宣布上线业界首个全生命周期MCP服务,无需用户管理资源、开发部署、工程运维等工作,5分钟即可快速搭建一个连接MCP服务的智能体。百度创始人李彦宏去年11月在百度世界2024大会的发言中就称,智能体是AI应用的最主流形态,即将迎来爆发点。
对于大模型厂商在智能体领域的集体发力,吴运声对本报记者表示,这源于大家都看到智能体技术快速发展,尤其是智能体具备自我规划和调用工具完成复杂任务的能力在不断增强,此外应用业务的发展需求随着技术提升也在增长,智能体能够更好地满足客户复杂多样的场景需求,“市场多家竞品百花齐放是好事,有利于技术发展。”
他同时表示,腾讯自身专注的是如何构建能力更强、更丰富的智能体应用,这需要调用多种已有能力和不同模型,“技术节奏的加快是被真实业务需求推动的。我们过去很多年的能力积累,现在正好借助大模型、Agent等最新范式重新激活,用更智能、更高效的方式去解决问题。”
据记者了解,腾讯今年一季度已经进行了一系列AI相关的组织架构变化。公开资料显示,今年2月,继腾讯元宝从TEG(技术工程事业群)转入CSIG(腾讯云与产业事业群)之后,QQ浏览器、搜狗输入法、AI智能工作台ima等产品应用和团队也将汇入CSIG。在5月21日的采访中,吴运声也提及,“不管是办公还是生活场景,浏览器都是非常核心的交互工具,如果智能体具备了使用浏览器的能力,那它的‘行为边界’就大大拓展了,可以覆盖很多真实场景。这也是我们平台赋予开发者和客户‘想象空间’的关键。”
他当天还透露,未来腾讯也在研发本地电脑的沙箱能力(ComputerUse 插件),让智能体可以操作本地软件、编辑文档、调用工具,就像一个“虚拟操作员”,“你设想一下,如果一个Agent不仅能上网,还能帮你打开Excel自动填报表格、用Photoshop批量裁剪图片,那它在企业内部的价值就会非常大。”
不过对于智能体的发展现状,深度科技研究院院长张孝荣对《华夏时报》记者表示,如何让用户觉得有价值并产生粘性,是智能体发展的关键挑战,其他还包括安全性与伦理问题、计算资源消耗、复杂工具使用以及多智能体交互机制等。他认为,智能体商业化进程还面临成本挑战,特别是在智能体交互过程中出现的错误循环和高token消耗问题。