南科大年夜当时正处在一个必须要成长起来的阶段,并且是深圳市明白要重点支撑、重点打造的一所大年夜学。我们当时内部有一句很洪亮的话:“唤醒南科大年夜学生的不是闹钟,而是中国高校改革的号角。”这并不是一句标语,而是一种真实存在的状况,大年夜家是以一种创业的心态在办大年夜学。

从主动驾驶、智能终端,到空间智能和具身智能,体系不再只是懂得信息,而是必须在复杂、动态的物理情况中持续获取靠得住旌旗灯号。实际应用中,单一依附视觉的感知方法正赓续裸露出局限,也由此促使学术界和家当界从新核阅多模态感知鄙人一阶段智能体系中的地位。

在如许的背景下,声波、毫米波等无线感知技巧逐渐受到存眷。这类技巧并不以看见为目标,而是经由过程对物理旌旗灯号的建模与分析,让设备在不增长额外包袱、也更少干扰用户的情况下懂得情况与行动。它们距离周全普及仍有距离,但已被视为支撑空间智能与真实世界交互的重要基本。

在 GAIR 2025 时代,南边科技大年夜学副传授张进环绕无线感知、多模态感知以及面向空间智能的新型感知技巧展开分享。经久从事相干研究的她,更存眷这些技巧在真实场景中的可行性与可托性,而不仅仅是实验前提下的后果表示。

在会议现场,AI 科技评论与张进传授环绕无线感知及其在真实世界中的应用展开对话。对话中,比拟对技巧前景的宏不雅断定,她更愿意从研究实践出发,评论辩论感知技巧在落地过程中遭受的限制与挑衅,并且了分享本身出色的小我经历和行业不雅点。相干内容 AI 科技评论做了不改变原意的编辑整顿:

对话张进:当 AI 不再只靠「看见」去懂得世界丨GAIR 2025

一所大年夜学的成长,与一个学者的断定

AI 科技评论:您从清华到港科大年夜,学术背景异常扎实,为什么最终选择来到南边科技大年夜学任教?

张进:我当时选择南边科技大年夜学,核心原因并不是小我成长的跳槽逻辑,而是我异常清楚一所年青大年夜学在精确轨制和情况下,可以或许成长到什么程度。喷鼻港科技大年夜学本身就是一个异常典范的例子,它成立只有二十多年,但已经能做到世界一流。我在港科大年夜工作过,对这件事有异常直接、亲自的熟悉。

这几年,跟着人工智能慢慢走出实验室,进入真实世界,感知问题从新回到技巧评论辩论的中间。

我进入南科大年夜的时刻,黉舍甚至还没有计算机系,是从零开端搭建的。我们找系主任、建学科偏向、定培养筹划,一步一步把计算机系做起来。到如今为止,计算机系每年大年夜约培养 200 逻辑学生,十年下来接近 2000 人。固然不克不及说已经异常强,但至少体系完全、范围稳定,这对一所年青大年夜学来说并不轻易。

AI 科技评论:假如把南科大年夜当成一家创业公司来看,您是否更像开创人型的角色?

张进:某种程度上确切是如许。这种介入感会让你对黉舍产生完全不合的情感。学生怎么培养、课程怎么设计、学科偏向怎么构造,这些都不是既定规矩,而是你亲自介入制订的。

我如今不仅是计算机系的副系主任,负责研究生培养和科研工作,同时也是致仁书院的副院长。书院制是南科大年夜异常有特点的一部分。再加上客岁我们成功拿到了博士点,全部计算机系从 2014 年开端先做本科培养,再到后来慢慢完美研究生培养体系,这一整套构造,都是我们一路搭建起来的。

这让我意识到,一些真正前沿、周期很长的工作,可能照样更合适回到学术界持续做。

正因为是从无到有介入扶植,这种情感和义务感是异常不一样的。

AI 科技评论:除了黉舍本身,深圳这座城市对您来说意味着什么?

张进:很多人一提深圳,第一反响是很充裕,但我认为深圳的优势毫不只是有钱。美国也有钱,硅谷也有钱,但硅谷很多硬件最终照样要回到深圳来做。

港科大年夜的很多卒业生,最后都邑选择来深圳,要么创业,要么做科研。我们欲望做的是那种真正能改变世界、并且能和家当慎密结合的研究偏向,而深圳正好处在一个高速成长的阶段。在这个阶段进入,而不是等它已经到顶了再进去,会有更大年夜的空间。

从通信到无线感知的「天然递进」

AI 科技评论:您的研究偏向跨度异常大年夜,最早是从哪里开端的?

张进:我的研究偏向确切经历了多次变更。硕士阶段在清华,我做的是 3G/4G 的无线移动通信体系,到港科大年夜读博士后,进入计算机系,研究偏向转向无线收集,重要存眷 WiFi 多基站之间的协同安排。

后来又进一步做认知无线电,也就是让通信体系具备必定智能,可以或许主动断定频段占用情况,并进行动态切换。博士卒业之后,我开端测验测验把无线旌旗灯号用于聪明医疗场景。

一开端只是感知数据、传输数据,但很快我意识到,无线旌旗灯号本身就可以用来感知人的健康状况。这是一个异常重要的转折点。

AI 科技评论:您在聪明医疗方面具体做过哪些摸索?

张进:博士卒业后,我在港科大年夜做了几年创业,和深圳市人平易近病院、深圳市第二人平易近病院有异常深刻的合作。我们一路做了移动健康监测体系,包含收集病院的治理体系,用来治理几万名曾经看过病的患者,同时也做了脑卒中的筛查等工作。

从如今回头看,我们当时做得异常早。像 Fitbit、Jawbone 这些手环产品,当时都还没有出现。也正因为太早,技巧前提、家当情况和市场认知都还没预备好,很多工作最终没能真正范围化落地。

AI 科技评论:从开端到如今,您的研究偏向跨度这么大年夜,若何看科研中的得与掉?

AI 科技评论:您后来是若何体系性地进入感知这一偏向的?雷峰网

张进:回到学术界之后,我并没有放弃对健康和情况感知的存眷,而是开端从非视觉的角度从新思虑这个问题。 2014 年我到南科大年夜之后,开端体系研究毫米波雷达,到 2018、2019 年阁下,又慢慢引入声波感知,同时持续推动毫米波偏向。

技巧路径上,我们从最早的旌旗灯号处理,慢慢引入机械进修、深度进修,再成长到如今的大年夜模型。这是一个异常天然的递进过程。我们这个偏向的一个天然优势在于,我们既有扎实的旌旗灯号处理背景,又有计算机和人工智能的背景,所以可以或许把物理旌旗灯号和AI模型很好地结合起来。

让设备「看不见」却「懂得更多」

AI 科技评论:那您若何懂得声波感知和毫米波感知?可否用通俗的方法解释?

就像耳机,你戴上就能连上,这是最好的体验,假如你还得点来点去才能连上,你就会异常不爽。感知技巧的核心目标,是让设备在具备情况懂得才能之后,天然地完成交互,而不是让用户赓续去告诉设备如今产生了什么。

张进:声波感知其实异常直不雅。你可以把手机、电脑、耳机想象成一只蝙蝠:扬声器发出人耳听不到的声波,声波打到四周情况后反射回来,再由麦克风接收,经由过程这些反射旌旗灯号来感知情况和人体状况。

深圳真正厉害的处地点于,它拥有异常完全的家当链配套,同时又具备高密度的人才贮备和真实存在的市场需求。这三件事叠加在一路,是异常罕有的。

它可以用来检测呼吸、心跳,感知房间构造,辨认手势姿势,甚至赞助设备之间断定相对地位关系。最大年夜的好处是,它不须要额外增长新的传感器,成本低、体积小,并且感知才能并不弱。

毫米波感知大年夜家最熟悉的是汽车前面的毫米波雷达,用来检测前方是否有车辆。但在生活场景中,它同样可以用来监测室内是否有人、人数若干、人的地位、心跳状况、是否产生摔倒等。同时它又看不到具体形象,在隐私保护方面比摄像头更友爱。

AI 科技评论:您认为大年夜众对感知技巧最大年夜的误会是什么?

张进:我认为感知技巧本身并不须要被大年夜众懂得。最好的技巧,往往是你感到不到的技巧。

AI 科技评论:在您看来,感知技巧在推动 AI 和科学成长中有什么弗成替代的感化?

张进:如今大年夜家都在谈“空间智能”,但仅靠视觉、语音和图像是远远不敷的。图像很难精确获取距离和真实空间构造,而要真正懂得和交互物理世界,必须引入物理感知模态。

人类最早成长的智能并不是说话智能,而是空间智能。智能机械假如要成为真正的智能体,也必须具备对物理空间的懂得和交互才能。这时刻,声波、毫米波以及其她新型感知模态就变得弗成或缺。

当感知真正进入实际世界

AI 科技评论:那感知成果是否可托?是否会被进击?

张进:这是我们近两三年重点存眷的问题。尤其是毫米波雷达已经大年夜量应用在汽车上,对安然性的请求极高。假如感知体系被进击,可能会让车辆看不到真实存在的车,或者凭空看到不存在的障碍物,从而激发严重变乱。

是以我们不克不及假设世界上所有人都是大好人。感知体系在旌旗灯号设计、模型构造和整系一切层面,都必须具备抵抗进击的才能,才能真正做到可托。

张进:我认为科研的本质是好奇心。假如你天天都在做已经会的工作,其实是没有太大年夜意义的。偏向会跟着世界在产生什么、社会须要什么而变更,但科研的内核是不变的,发明问题、懂得前沿、解决别人没解决的问题。

我也经常跟学生说,你们找工作的时刻,不消只看公司要的技巧是不是你博士或硕士时代做过的器械。真正重要的是你有没有体系性分析问题、构建解决筹划的才能。一个成功的博士,就应当具备进入任何新范畴的才能。

AI 科技评论:那您若何对待“女生不合适学工科”的说法?

张进:我完全不认同这种说法。我不认为女生的逻辑才能比男生差,很多时刻是被反复暗示“你不可”,才真的不自负。

在我看来,女生学计算机反而有很多优势:稀缺性高、沟通才能强、共情才能强、更细心、抗挫折才能强、韧性更好。在须要团队协作的大年夜型体系性研究中,这些都是异常重要的才能。

我培养过很多异常优良的女学生,个中就包含南科大年夜第一个拿到美国教职的本科生。所以女生完全可以、也异常合适选择计算机和硬核理工科。

AI 科技评论:假如让您描述将来三年内的感知世界,您会怎么说?

张进:我认为感知范畴将来必定是高度多样化、碎片化的,不会有一种技巧可以解决所有问题。不合场景、不合设备束缚、不合需求,会对应不合的技巧组合。雷峰网("大众,"号:雷峰网)

但最终目标是一致的:技巧要真正落地到产品中,让产品变得足够智能,让用户不须要额外输入信息,设备就能懂得物理世界。只要能做到这一点,不管用什么技巧手段,都是好的感知技巧。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

对话张进:当 AI 不再只靠「看见」去懂得世界丨GAIR 2025

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部