腾讯云吴运声:构建实用好用的企业级智能体,让AI人人可用
2025-09-19 16:57 www.eastfi.com来源:东方财经网作者:综合阅读:次
9月17日,在2025腾讯全球数字生态大会AI Agent产业应用峰会上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,腾讯将通过全栈式智能体解决方案,帮助企业构建真正实用、好用的企业级智能体,实现“AI人人可用”,助力产业创新升级。
腾讯云副总裁、腾讯云智能及优图实验室负责人吴运声
吴运声指出,在智能体开发领域,腾讯云已形成覆盖B端与C端的“双平台”体系。面向企业客户,腾讯云智能体开发平台(ADP)提供全面的知识库构建能力和多种开发框架,支持私有化部署、企业级权限管控等,具备强大的系统集成与业务适配能力。而在C端,腾讯元器平台依托腾讯生态,支持用户一键将公众号、文档等内容转化为智能体,极大降低创建和分发门槛,快速触达终端用户。
目前,腾讯云智能体开发平台已在多个实际场景中广泛应用。除常见的知识问答类场景,如政务服务、企业内部知识问答、售后咨询等,还深入工业质检、智能巡检、媒体内容处理及营销自动化等复杂场景。例如在质检环节,腾讯云借助大模型与Agent技术,将样本需求从千级降至数十张,显著提升缺陷识别效率;在融媒体领域,智能体可实现视频语意的多模态理解,帮助内容机构高效管理媒资库。
本次发布的腾讯云智能体开发平台3.0,作为面向全球用户的企业级平台,集成RAG、Workflow、Multi-Agent等核心能力,提供自动化评测、多层权限配置等能力,帮助企业智能体安全、放心落地。平台还提供模型广场,不仅支持混元、DeepSeek等主流模型即插即用,还支持企业便捷接入自有模型。
在落地层面,腾讯云智能体开发平台已在多个行业头部客户中取得显著成效。例如与宝安区政数局合作,集成民生、企业、政务等多类服务,实现全区“一网通办”;为邯郸公积金中心搭建“数字柜台”,整合身份验证、电子签章等工作流插件,试运行首周,平台受理咨询2475笔,问题解答率达82%;在酒店行业,协助华住集团构建38条工作流,覆盖客户咨询、周边推荐等高频场景,有效减轻人力负担。
吴运声强调,腾讯始终秉持“以人为本”的技术理念,持续推进技术开源与生态共建。腾讯优图实验室9月开源了Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架。前者以极简设计与高性能兼顾科研和应用,不依赖海外闭源模型即可取得优秀效果;后者通过Schema引导与知识树构建,在Token成本和精度上显著优于现有框架。接下来,优图实验室还将陆续开源Youtu-Embedding、Video-MME V2、Youtu-Parsing等能力。
以下为演讲全文:
非常高兴今天在这里跟大家分享我们在企业级智能体构建上的进展。
最近智能体确实非常火热,所有的企业都觉得一定要做智能体,不做智能体,根本跟不上潮流了。但是另外一方面,所有的企业也都有自己的困惑:智能体到底要做什么样的场景?在落地的过程中会遇到什么样的困难?
为了帮助企业更好地落地智能体,腾讯提供了全栈智能体解决方案,包括最底层的AI Infra到中间层的平台再到上层的生态。接下来我将分享下智能体落地场景和应用、智能体开发平台的产品进展,以及我们开源的想法和思路。
首先是智能体的落地场景。过去一年多,智能体的落地场景基本都聚焦在知识问答上。比如,企业内部的员工专家助手、对外的民生政务政法问答、企业售前售后咨询等,都可以被归纳为知识问答。企业把相关知识或产品数据放到知识库中,通过强大的RAG能力、工作流的能力和Agent的能力解答用户的问题。
除了这种知识问答场景之外,我们也在探索更多智能体落地的场景并且取得了相应的进展,包括巡检、质检、媒体处理等。
首先是智能质检场景。熟悉我们的朋友都知道,在工业质检领域,腾讯云的技术是非常领先的。我们在工业质检上积累了很多底层技术,但工业质检开拓新场景时,还是比较重的,通常需要超过一千张新场景图片做训练。
我们也在思考,能不能结合过往已有的技术积累以及最新的大模型和智能体技术,让整个过程变得更加简单和高效,答案是可以的。我们借助智能体技术,使用少于50张图片,直接送到智能体里面,让智能体自己分析图片。这个过程有可能是使用过往已经积累的工业质检技术的插件,也可以直接使用已经有泛化能力的多模态插件,交付效率大大提升。
另外一个场景就是智能巡检。实际的生产环境中,很多都会用到这个能力,比如去看井盖有没有丢,建筑工地工人有没有穿着正确的服装,有没有山火,河道水位有没有超线等。过去在面临新场景时,我们通常会找到这个场景里的若干样本,单独训练一些小模型,用小模型解决这个场景里的问题。今天,在智能体开发平台上,我们结合过去积累的大量技术,以及针对某些特定场景的小模型,再结合大语言模型的能力、Agent的能力,就能够快速形成解决方案,适配智能巡检的不同场景。
媒体处理场景中,用户经常要对媒体内容做各种查询和分析,首先要打标签,再对一段媒体进行切片分段。比如春节联欢晚会四个小时的视频,切成了几百段,当要找其中某一段时,搜索的过程还是比较麻烦的。在过往的技术中,这种搜索的过程往往取决于对一个单独切片视频打标签的结果,通过标签来搜索,对整个视频语意的理解是缺乏的。现在,我们基于已有的标签和视频切片积累的能力以及目前的大模型多模态理解能力,在媒体内容处理领域也做一个Agent,取得了不错的效果。
在营销领域,过去要制定一个营销活动,有非常多步骤以及人为过程。首先需要圈定人群、选品、制定特定广告语,再选择合适的营销渠道推广出去,得到反馈之后,还有效果分析环节,这一系列过程非常复杂。同样我们在思考,既然有这么多人完成这些事情,能不能每个环节都由Agent来实现?再把这些Agent串联起来实现效果,答案也是可以的。我们做了人群圈定的Agent、商品选择的Agent、内容生产的Agent、渠道分发的Agent以及最后效果分析的Agent,把这些Agent自动串联起来,就可以很方便完成一个营销方案。
除了这些面向企业的智能体,面向个人也可以有很多好玩的东西。在座的朋友们,在过去多年的工作、生活过程中一定都积累了很多知识、经验,能不能把自己积累的这些知识做成一个IP Agent对外提供呢?也是可以的。我们也做了一些实践,后面有一些案例可以分享给大家。
这些场景上的应用离不开我们在产品上的创新,接下来我也会跟大家介绍下我们在产品上的进展。
腾讯云有两大智能体开发平台。一个是面向TOB的——腾讯云智能体开发平台,有完整的智能体构建能力,可以提供全方位的企业级能力,比如云资源的连接、专业的开发框架和灵活的部署能力。还有面向C端的平台——腾讯元器,可以一键构建公众号智能体,同样提供相应腾讯生态的支持和C端流量支持,让大家更好更方便地构建个人智能体。
今天很高兴跟大家正式宣布,我们刚刚发布了腾讯云智能体开发平台3.0版本,提供更加完善的企业智能体开发能力和基础设施,底层提供身份权限、合规、运行环境等基础能力,中间有RAG引擎、工作流引擎、Agent引擎。同时还有很多配套能力,包括模型广场、插件广场等。
除上述能力之外,还设有实践经验板块。我们认识到,开发一个智能体不仅涉及技术实现,更与开发者的认知和经验积累密切相关。因此,我们将多年积累的能力与实践经验进行了沉淀,形成了多种应用模板,帮助用户更好构建智能体。此外,我们还将推出一系列有关智能体构建的课程,全方位辅助用户更高效地开发智能体。
目前,我们的RAG能力——包括知识库检索、文档解析、OCR等,正在持续迭代。文档解析已支持更丰富的内容类型,进一步节省成本。在结构化检索方面,依托Agent技术,实现了显著的能力增强。同时,我们已将传统RAG升级为Agentic RAG。传统RAG通常在用户提问后,通过拆解问题元素,检索知识库并汇总返回结果;Agentic RAG可以通过大模型自动拆解问题,通过多步查询,最终拿到结果,这是一个更智能化的技术。
此外,我们全面升级了Multi-Agent能力,支持多方式配置Agent协同,支持自由转交、工作流编排、P&E协同模版等。在实际落地过程中,Agent不仅可与其他Agent互动,还能与确定性节点进行交互。通过将Agent融入工作流,用户可在编排中明确指定Agent之间的协作机制,并结合现有节点构建更强大的应用。我们还推出了经过长期沉淀的P&E协同模板,通过内置的Planner Agent和 Executor Agent协同,能够针对任务自动规划步骤、调度相应Agent执行,并具备自我验证机制,最终达成目标。
除了RAG与Agent能力,智能体的实战应用离不开评测体系的支撑。腾讯云智能体开发平台3.0同时支持基准评测与对比评测,并提供多种打分方式,如裁判模型、规则匹配、自定义代码等,也可进行多模型或多提示词的自动对比评测。
有了这些能力后,智能体要想真正在企业落地,还有一个绕不开的问题——权限。尤其对于大企业来说,所涉及到的内容、知识、组织人员非常之庞大,不同的人、不同的组织,对不同的内容都会有不同的访问权限。在腾讯云智能体开发平台3.0版本中,我们推出了两级权限体系,企业级权限体系支持内容可见权限与用户添加管理;空间内部则进一步细分功能与数据权限。空间管理员可灵活分配成员权限,实现对知识库内容与应用功能的精细控制,从而支持智能体在大规模企业环境中的安全部署。
除了前述能力,还有很多以往内容的沉淀。除插件外,我们推出模型广场,除内置模型外,还支持几乎所有主流第三方模型。用户通过简单配置API即可调用,若模型训练于腾讯云TI平台,则可直接授权使用;符合OpenAI兼容协议的外部模型也可快速接入。
腾讯云智能体开发平台已在腾讯内部多项业务中广泛应用。例如腾讯学堂依托智能体开发平台打造问答助手,为全体员工的学习提供支持;QQ浏览器基于我们的平台打造了下载助手等智能体;腾讯乐享知识库的底层也是基于我们的RAG能力。
接下来也给大家介绍一下我们外部的案例。宝安区政数局需要提供一类服务,解答辖区内的居民关于民生、企业服务、政务办公、社会治理等各类事务的问询。他们所积累的内容、格式十分复杂,数量也很大。在腾讯云智能体开发平台里,我们将所有内容都一键导入平台,快速构建起问答智能体,实现了很好的效果。
另外一个例子,是跟邯郸公积金的合作。办理公积金业务时,用户不只会问到公积金政策相关的问题,还需要验证身份、刷脸、签订协议等。我们跟邯郸公积金的协作极大缩短了流程,将身份验证、刷脸、电子签等技术以插件形式嵌入工作流,搭配原有业务流程,实现一站式构建业务处理过程,大幅提升业务处理效率。
在住宿场景中,经常会有这种情况,顾客给前台打电话,问前台如何把空调温度调低、询问早餐时间、WIFI等各种需求。或者问跟酒店无关的问题,比如周边推荐、美食推荐等。在跟华住集团的合作中,我们为华住搭建了30多条工作流,覆盖了酒店信息、酒店周边查询等多元场景服务,并且具备快速响应能力,在实践中取得了很好的效果。
在IP Agent方面,吴晓波把他在过去十几年间积累的行业洞察、投资理财等相关知识,整理成知识库,并且结合数智人技术,构建起自己的IP Agent。我们还与杨国安教授一起合作构建了一个“杨国安+”小程序的IP Agent,可以实现7×24小时跟杨国安对话,随时随地获取顶级教授一对一的指引。我们也希望未来有更多人构建自己的IP Agent,把自己积累的知识传递给更多的用户。
除了面向TOB领域的腾讯云智能体开发平台,我们面向C端用户的腾讯元器可以帮助用户一键将积累的公众号文章导入智能体构建知识库。例如我们与中国石化“小石头”公众号的合作,已实现千万级粉丝基础上的智能问答服务,智能回复油价、开票等信息。
最后,也汇报一下我们关于开源的思考和进展。在过去一段时间里,智能体的发展迅速,腾讯也积累了很多经验,秉承技术普惠与开放共建的理念,我们决定将过去所积累的智能体技术陆续开源,促进智能体生态的快速发展。
我们优图实验室9月率先开源了Youtu-Agent智能体框架和Youtu-GraphRAG知识图谱框架。前者以极简设计与高性能兼顾科研和应用,不依赖海外闭源模型即可取得优秀效果;后者通过Schema引导与知识树构建,在Token成本和精度上显著优于现有框架。即将开源的Embedding能力,是整个RAG的基础,因为Embedding做得好不好决定了之后的语义检索能不能做到更好的效果,这个也敬请大家期待。
腾讯多年来始终秉承以人为本的理念,我们希望技术真正为人服务,在智能体时代,我们希望构建出真正实用、真正好用的企业级智能体,让AI人人可用,助力产业创新升级。
谢谢大家!