在城市数字化赓续加快的今天,交通治理、情况监测、公共安然等关键范畴都面对着一个合营挑衅:数据来源分散、质量参差不齐、传感器覆盖有限,导致很多真实世界问题无法依附单一数据或单一模型得出稳定靠得住的断定。
跟着城市体系范围敏捷扩大年夜,若何整合多源信息,让人工智能真正懂得并洞察实际世界,已经成为家当界与科研界合营存眷的核心课题。在这一背景下,经久深耕城市计算和多模态智能研究的郑宇传授,用一篇论文为行业带来了具有体系性冲破性的跨域多模态常识融合框架。
郑宇传授现任京东集团副总裁、京东科技首席数据科学家,是 IEEE Fellow、ACM 出色科学家,在城市计算、时空大年夜数据与人工智能落处所面具有国际领先影响力。他的研究不仅推动了理论成长,也在多个城市应用中取得了重要实践成果。
值得存眷的是,郑宇传授将出席雷峰网 2025 年 GAIR 全球人工智能与机械人大年夜会,并分享他在跨域多模态融合与城市智能方面的最新进展。GAIR 大年夜会聚焦人工智能的核心技巧、前沿趋势与家当落地,经久吸引来自全球的技巧领袖和科研人士。
总体来看,这项研究的意义表如今几个方面。
本届大年夜会将于 2025 年 12 月 12—13 日在深圳·博林天瑞喜来登酒店举办,与家当界和学术界的嘉宾合营商量人工智能的下一步成长。

论文地址:https://arxiv.org/pdf/2506.03155
融合跨域常识,让模型懂得城市
起首,在空气质量揣摸与猜测义务中,模型融合空气监测站数据、气候不雅测、门路与建筑构造、POI 信息以及车辆移动等多范畴数据,可以或许从多个互补维度描述城市污染过程。
与只依附单一数据源的模型比拟,融合模型在将来多小时至两天的空气质量趋势猜测中表示加倍稳定,对污染的突发性变更具有更高的捕获才能,并能更精确地定位局地污染热点,即便在监测站稀少的区域,也能根据周边交通行动、地盘应用与气候模式合理揣摸污染情况。

其次,在城市运行监测中,单个数据源往往难以辨认稍微却可能激发重大年夜后续影响的异常事宜,而融合多源数据后,模型可以或许捕获来自交通流量、社交媒体活动和共享单车应用等多类数据在同一时空范围内的细微同步偏离,从而提前辨认弱影响交通变乱、局部人群集合、情况污染初期释放以及门路施工等事宜,明显晋升了异常检测的及时性,为治理部分供给更早的干涉时光窗口。

最后,在传感器覆盖不足的情况下,如门路速度估计和城市噪声揣摸义务中,模型借助跨域信息,信息包含门路物理属性、区域功能特点与城市构造规律,仍能在极为稀少的数据情况中做出稳定、可托的揣摸。
实验成果显示,这种办法不仅能为本来无监测数据的门路生成连贯、合理的估计成果,并且能有效降低稀少区域的揣摸误差,清除空间上的“断层”现象,明显晋升数据缺掉前提下的整体揣摸质量。


总体而言,跨域常识的融入冲破了传感器不足的限制,使模型在复杂、动态、数据不完全的真实城市情况中依然具备靠得住而强大年夜的智能推理才能。
跨域融合的四个核心阶段
实验成果之外,这项研究的实验过程也遵守了一个完全而体系的跨域融合流程,依次包含数据选择、常识对齐、模型构建与数据转换四个核心阶段。
起首,在数据选择阶段,须要明白义务相干的数据来源并分析问题的根因。例如在空气质量揣摸中,污染受本地排放、区域传输、气候扩散和化学反响等身分合营影响,是以必须从不合范畴筛选与这些身分对应的数据,包含反应地盘应用的门路收集和 POI、反应人类活动的出租车轨迹、反应扩散前提的气候数据以及供给真实污染读数的监测站数据。因为这些数据来自交通、城市筹划、气候与情况监测等多个范畴,它们构成了典范的跨域数据组合。
随后,在常识对齐阶段,须要肯定这些异构数据为何可以或许被融合。研究经由过程多视角、类似性、依附性与共性四类原则来建立不合数据之间的接洽。
整体来看,这项研究提出的跨域多模态常识融合框架在多个真实应用处景中展示出明显优势,实验成果重要表如今猜测精度、异常辨认才能以及稀少数据揣摸才能的周全晋升。
多视角原则认为来自不合范畴的数据可以或许从不合角度描述同一对象,类似性原则强调同类对象之间往往具有一致的构造或行动模式,依附性原则指出不合对象的性质可能存在概率性接洽关系,共性原则则强调不合范畴之间可能共享某些潜在构造,如周期性规律或人类活动模式。这些原则为跨域数据之间的互补性供给了理论基本。

在模型构建阶段,作者提出精确融合和粗粒度融合两种范式:前者实用于因果关系明白、数据量有限的义务,平日基于构造化建模办法,例如矩阵分化、图构造建模和显式变量设计。后者实用于数据范围大年夜、关系复杂且无法完全由先验常识描述的场景,更多依附深度进修的主动建模才能,经由过程卷积收集、轮回收集、图神经收集或留意力机制等构造捕获潜在规律。

最后,在数据转换阶段,须要将不合模态的数据处理成可直接输入模型的情势。具体包含对所稀有据进行清洗、切片和插值等预处理,对构造明白的数据进行精确转换,如构建门路收集图或计算监测站间的空间关系,以及对文本、图像或轨迹等复杂数据进行粗转换,经由过程编码器或嵌入模型提取同一长度的向量表示。完成这些转换后,所有跨域数据即可同一输入到构建好的模型中,支撑全部实验流程的练习与推理。

面向真实城市的赋能路径
起首,它解决了实际世界中数据不敷用的难题。在交通、情况和城市治理等范畴,传感器数量有限、采集成本高,很多处所根本没稀有据可用。跨域融合的办法可以或许应用其他范畴已经存在的数据来弥补这些缺口,不须要额外增长设备,也能让模型在数据稀少的情况下保持优胜表示。这让各类智能体系在真实城市情况中的应用变得加倍可行。
其次,这项研究提出了一套体系的跨域多模态融合理论,包含多视角、类似性、依附性和共性等原则,为不合范畴的数据若何组合、若何一路发挥感化供给了清楚的根据,避免了以往“靠经验乱拼数据”的做法,也让将来的模型设计有了更规范的偏向。
再次,研究的意义还在于推动人工智能从重要处理图像、文本等虚拟世界数据,走向解决实际世界的城市问题。经由过程这套融合框架,多模态技巧可以在交通猜测、空气质量揣摸、能源治理等更切近生活的场景中展示价值,赞助当局和企业晋升城市治理的效力和智能化程度。雷峰网("大众,"号:雷峰网)
最后,这项研究也为跨部分的数据协作供给了新的可能。城市里的数据往往分散在不合机构,各自自力难以应用,而跨域融合的思路让这些本来孤立的数据可以或许合营办事于更复杂、更重要的义务,为将来扶植更高程度的聪明城市供给了一条清楚的路径。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。

发表评论 取消回复