
▼
在人工智能技术狂飙突进的2025年,一场以“AI+”为核心的科技盛宴——“AI+研发数字峰会(AiDD)”即将于5月23-24日上海举办,本届峰会以“拥抱AI,重塑研发”为主题,汇聚了全球顶尖学者、企业领袖与技术实践者。从金融、制造到汽车、新能源,从多智能体协同到具身智能,这场峰会不仅揭开了大模型时代的技术演进密码,更描绘了AI Agent(智能体)如何深度融入人类社会、重构产业生态的宏伟蓝图。

一、多智能体协同决策:大模型让机器学会“团队作战”在复杂现实场景中,单个AI模型往往难以应对动态变化的环境和多元任务需求。多智能体协同决策技术,正通过大模型的“全局智慧”,让多个AI智能体像人类团队一样分工协作、自主进化。
杨思蓓——现任上海科技大学信息科学与技术学院助理教授,2020年获香港大学博士学位,研究方向聚焦计算机视觉与自然语言处理的交叉领域,其团队在CVPR/ECCV/NeurIPS等顶会发表多模态学习相关论文20余篇。
杨思蓓教授在论坛中提出的“可信多模态系统”,为这一领域提供了系统性技术框架:环境感知层:通过将物体功能属性融入视觉识别,解决动态场景中的语义鸿沟问题。例如,在自动驾驶场景中,系统不仅能识别“前方有障碍物”,还能理解“障碍物是移动的行人还是静止的车辆”,从而动态调整决策策略。认知决策层:模块化思维链架构让推理过程透明可控。通过拆解任务为可验证的子目标,智能体能像人类一样“分步骤思考”,并在金融风控、智能制造等领域实现高可信决策。表征学习层:VideoLLM时空解耦框架突破了传统视频理解的局限性,让智能体能够从时序数据中提取因果逻辑。这对工业质检、智慧城市管理等需要时序推理的场景至关重要。生成验证层:基于多模态证据链的幻觉消解技术,确保智能体输出结果与物理世界的一致性。在医疗诊断、法律咨询等高精度领域,这一技术将大幅降低AI的“胡言乱语”风险。应用场景:在智慧物流仓库中,搬运机器人、分拣AI和调度系统组成多智能体网络,通过实时环境感知与动态任务分配,整体效率提升40%;在金融投研领域,多个AI分析师协同完成数据采集、趋势预测与报告生成,人力成本降低70%。二、具身智能:当AI拥有“身体”,人机共生的新时代如果说多智能体协同是让AI学会“群体智慧”,那么具身智能(Embodied AI)则让AI真正拥有了与物理世界交互的“身体”。刘迅院长在报告中指出:“具身智能的终极目标,是让机器人不仅能理解人类语言,还能通过表情、动作和场景上下文,实现有温度的交互。”
刘 迅——数字华夏 研究院院长,正高级工程师,浙江大学计算机科学博士,师从张三元老师,苏步青院士门徒。历任华为高级算法工程师、扩博智能机器视觉专家、普适导航研究院院长。在人形及特种机器人领域持有国家发明专利11件,国际发明专利1件,SCI等高水平论文7篇。
- 多模态感知融合:通过视觉、语音、触觉等多维度数据,机器人可实时捕捉用户的微表情、语调变化甚至环境氛围。例如,在心理咨询场景中,AI能通过用户低头搓手的动作判断其焦虑情绪,并调整回应策略。
- 情商大模型微调:基于提示词工程与场景化训练,机器人可学会“共情表达”。某展厅导览机器人已能根据观众停留时间自动调整讲解深度,并在检测到儿童用户时切换为卡通化语言风格。
- 多模态表达生成:结合动作、表情与语音合成技术,人形机器人可完成拟人化互动。现场展示的“情感辅导机器人”能模拟点头、微笑等肢体语言,让用户体验接近真人对话。
在养老护理领域,具身智能机器人可协助监测老人健康状态,并通过自然对话缓解孤独感;在教育行业,AI教师能根据学生注意力水平动态调整教学节奏,个性化教育成本降低90%。三、企业级AI应用:从“工具堆砌”到“全流程智能体革命”企业数字化转型的深水区,正从“单点工具智能化”转向“全流程AI Agent重构”。罗宇超CEO以苏州云体科技研发的MappingSpace平台为例,揭示了AI如何颠覆传统工业软件开发生态:
罗宇超——苏州云体科技有限公司 CEO,德国卡尔斯鲁厄理工学院 (KIT) 汽车技术专业硕士毕业。主要研究方向是新能源汽车技术、研发流程数字化、AI工业软件、质量管理等。先后在蔚来汽车与上汽零束,从事整车软件研发流程质量管理与工具链开发工作。
- 需求到测试的AI流水线:通过大模型自动生成需求文档、测试用例与合规分析报告,开发周期从数月缩短至72小时。
- 多智能体协同开发:代码管理AI、测试AI与部署AI组成“虚拟技术团队”,实时交互并自主修复漏洞。某汽车制造企业的线控系统开发中,AI智能体协作发现23%的传统测试盲区。
- 打破数据孤岛:通过智能体间的标准化接口,历史遗留系统与新模块实现无缝对接。某电子企业的供应链管理系统改造中,数据利用率从35%跃升至89%。
工业领域的AI Agent将向“自适应专家系统”进化。例如,在新能源电池产线中,AI不仅能实时监测设备状态,还能通过历史数据学习预测工艺参数的最优解,良品率提升18%。当大模型从云端下沉至手机、PC等终端设备,多模态智能体正在掀起一场“端侧智能革命”。徐海洋专家团队开发的Mobile-Agent技术体系(CCL2024 Best Demo获奖项目),展示了这一领域的无限可能:
徐海洋——阿里通义实验室高级算法专家,负责通义多模态大模型mPLUG、Mobile-Agent系列工作,包括基础多模态模型mPLUG/mPLUG-2,多模态对话大模型mPLUG-Owl/Owl2,多模态文档大模型mPLUG-DocOwl,多模态智能体Mobile-Agent、PC-Agent等,其中 mPLUG 工作在 VQA 榜单首超人类的成绩,Mobile-Agent工作CCL2024 Best Demo,获得多个多模态榜单第一和Best Paper。
- Mobile-Agent单智能体:可在手机端完成跨APP任务,例如根据用户指令“订明早8点虹桥机场的网约车,途经全家便利店买早餐”,自动调用地图、打车、支付等多应用接口。
- 多智能体协作版V2:PC与手机智能体联动办公。当用户说“把今晚会议纪要发给客户”,PC端自动提取文档,手机端智能体通过微信发送并同步确认对方接收状态。
- 自主进化型E系列:通过强化学习,智能体可基于用户反馈优化操作路径。测试显示,重复性任务执行效率每季度提升12%。
在智能汽车场景中,车载智能体可同步处理语音指令、路况感知与乘客情绪,实现“管家级服务”;在跨境电商领域,端侧智能体自动完成多语言商品上架、汇率结算与物流跟踪,运营效率提升5倍。五、结语:智能体——打开人机共融的潘多拉魔盒
从工厂车间的多智能体网络,到家庭中的人形机器人,AI Agent正在突破虚拟与物理世界的边界。这场变革不仅是技术的跃进,更是人类协作方式、产业组织形态的重构。正如峰会圆桌论坛中多位专家共识:“未来十年,不会使用智能体协同工作的企业,将如今天不会用电的企业一样被淘汰。”
而随着具身智能、多模态交互等技术的成熟,一个更激动人心的未来图景正在显现:AI将不再是冰冷的工具,而是拥有“感知-思考-行动”完整能力的伙伴。这场智能体革命,或许正是通向通用人工智能(AGI)的最后一块拼图。AiDD峰会论坛的召开,为我们提供了一个深入了解和探讨AI技术赋能千行百业的重要平台。通过本次论坛的交流和分享,我们可以更加清晰地看到AI技术在推动产业升级和提升研发效能方面的巨大潜力。未来,让我们携手共进,共同推动AI技术的发展和应用,为构建更加美好的未来贡献智慧和力量。
AiDD峰会更多精彩内容抢先看!
欢迎扫描下方二维码分享您的AI落地实践成果,或参会与更多的技术同仁交流学习。
