对话上海交大AI研究院沈为:我相信奇点将至但更信脚踏实地

2024-09-25 12:30:00
aiadmin
原创
228

曾任约翰霍普金斯大学盘算推算机系助理斟酌教员。斟酌目标为盘算推算机视觉、深度练习与医学影像解决,体贴弱监视/无监视下图像决裂等视觉识别职司。颁发IEEE TPAMI、IEEE TIP、IEEE TMI、NeurIPS、CVPR等人工智能合系范围顶级期刊和集会50众篇,谷歌学术援用1万众次。掌握NeurIPS 2023/2024、CVPR 2022/2023、ACCV 2022范围主席,掌握SCI一区期刊Pattern Recognition编委、上海市盘算推算机学会盘算推算机视觉专委副主任。代外性作事得回MICCAI 2023青年科学家奖。邦度优青,入选上海领甲士才(海外)。

这两年,直播间有个极具人命力的梗,叫做“你这靠山太假了”。仅抖音平台的合系衍生线亿播放量。每当主播的靠山结果过于颤动、秀雅,就会被网友央浼“自证”,譬喻光脚淌水、向死后扔矿泉水瓶等。

难分真假的吃瓜全体,之因而对自身的眼睛愈发不自尊,深层原故正在于盘算推算机的“眼睛”越来越强健。跟着图像决裂算法不停优化,直播间、视频集会里的虚拟靠山,仍旧能够和人物不露漏洞的丝滑跟尾,为作事、文娱带去更众浸醉体验。

他曾正在众项邦度自然科学基金的项目斟酌中,筑设起形式向导的图像决裂盘算推算机制和手腕,为合系使用的发达供给了踏实的学术外面支持。眼下,他正指导团队通过盘算推算机视觉和深度练习,为医学影像行业赋能。

正在沈为身上,你会看到一种兴味的“对立联合”:他苏醒认识到现有AI基石——盘算推算机“冯诺依曼体例”的限定性,以为“唯有底层手艺革命,才略冲破现有瓶颈”。同时又高兴脚结壮地,正在现有框架下,朝盘算推算机视觉范围的最顶峰陆续攀缘。

埋头、寂静、重理性头脑,是学界人士的基础特质。但沈为与盘算推算机视觉范围结缘,却源于一次原故不那么理性的“半道削发”。

“我的专业要紧与信号、声波、频谱打交道,这些东西看不睹摸不着。而我又是一个对画面感有盼望和找寻的人,小功夫的许众兴味和梦念都是源于少许有画面感的事物。”

为了做出蜕变,他以专业课中的“图像解决”为跳板,正在读博时刻转向盘算推算机视觉范围。他的博士生副导师,华中科技大学教员白翔为他带去了许众踊跃影响。

偶然的是,白翔教员也是“半道削发”,并履历过一段十分辛苦的转型进程。但这没有阻碍他成为人工智能行业、场景文字检测与识别手艺的尖端人才。白翔教员确信“兴味的气力”,并勉励学生插手学术竞赛与实战项目,去接触使用场景中切实的数据、算法和编制,从而有用避免“闭门制车”,正在斟酌的确题目时赢得冲破。

正在白翔教员的引荐下,沈为前去微软亚洲斟酌院操演,并取得了微软亚洲斟酌院高级斟酌员、加州大学圣地亚哥大学教员屠卓文的指挥和助助。屠卓文教员的许众作事内容,都处于学界最前沿。同时他又是一位自身上手写代码,亲力亲为的导师。正在他的引颈下,沈为正在盘算推算机视觉和深度练习范围不停扩展视野,积聚了厚实的履历。

2014年,仍旧回邦任教的他滥觞推进“基于深度练习的边际检测”项目,为了赶论文进度一度抵达夜以继日的水准。时间不负有心人,一年后,合系斟酌效率得回环球盘算推算机视觉顶级集会CVPR的颁发,并取得学术圈通俗体贴和援用。

恰是这篇论文,正在肯定水准上推进了边际检测的跃进发达,通过深度练习让物体与物体间的畛域、杂沓靠山的噪声影响取得更强辨别性,治理了虚拟靠山等使用不足缜密、穿模的题目。

几年后,仍旧正在业内有所筑树的沈为决意前去美邦约翰斯·霍普金斯大学盘算推算机科学系举行互换练习。也是这时刻,他人命中第三位意思杰出的恩师崭露了——知名物理学家史霍金的喜悦弟子,盘算推算机视觉学科涤讪人之一的艾伦·尤尔。

艾伦·尤尔教员勉力于推进人工智能与医疗影像方面的使用场景相联结,以此来辅助大夫普及作事作用。

他较早意念到贝叶斯定理正在盘算推算机视觉范围的使用上风,并正在“基于CT影像的早期胰腺癌诊断”项目中赢得众项冲破。沈为就曾参加到该项目中,并提超群项CT影像中胰腺肿瘤决裂手艺。

正在三位教员的影响下,沈为从一个“被画面感所吸引”的学者,滋长为盘算推算机视觉与深度练习范围的手艺专家,一步步找到了自身的“人生坐标”。

万卡集群时期的开启,让AI范围取得了难以想象的加快率。主动驾驶、ChatGPT、人形呆板人、Sora、百模大战...热门频出确当下,越来越众科学家与学术大牛采选下场创业,或是斥地少许离热门更近的斟酌目标。

但沈为仍然采选留正在“实行室”里,他永远以为,热门不是用来追赶的,而是应当把热门中的代价导入自身的斟酌目标。

这种昭着的历久主义特质,好像也是从三位恩师身上传承而来。参加上海交通大学人工智能斟酌院以还,沈为的要紧斟酌目标仍然聚积正在“老本行”——图像决裂与医学影像认识。

图像决裂是助助盘算推算机分解图像消息、提取图像数据的环节一环。小到虚拟靠山,大到工业筑筑、主动驾驶、人形呆板人,都须要不停普及决裂精度,才有或许落成最终落地。

沈为现阶段的要紧作事,便是通过医学图像决裂模子办事于病院等场景。譬喻,让搭载了AI算法的CT可能自助识别肺结节、肺结核、胰腺肿瘤,特别是低比较度的病灶。正在他看来,跟着这些手艺与硬件相联结,可认为大夫供给一层“科技漏斗”,助助大夫过滤掉繁琐的作事内容,让他们有更众元气心灵埋头于诊断和施策。

正在项目配合中沈为发觉,医学图像的优质数据高度依赖大夫的标注,但这势必会为他们的平时作事带去骚扰。为此,他测验通过手艺立异,正在弱监视情况下,达成与全监视情况相当的决裂精度。同时正在算法中导入大夫的优越履历,让AI可能物尽其用。他的个别斟酌效率仍旧正在某医疗科技巨头的产物上得胜落地,为病院带去了作用提拔。

埋头于本职作事的同时,沈为还踊跃与邦度立异项目伸开配合。目前,他参加了金山云和瑞金病院牵头的邦度中心研宣告置——虚拟手术。

“优越主刀大夫的缺乏,仍旧成为环球限制的待解困难。相较于其它行业,大夫的作育加倍耗时。特别是主刀大夫,须要大批实习时机提拔履历。但每个躺正在手术台上的患者,都不期望自身成为‘小白鼠’。因而年青大夫只可通过假人、动物举行手术练习。”

虚拟手术项宗旨提议,便是期望修建一个还原度极高的仿真情况,通过医学影像的决裂、手术场景的重筑、三维器官的出现,让医学院的学子们取得更众实操时机。

2023年,沈为和团队的重磅斟酌效率“基于神经辐射场的内窥镜手术场景结构动态三维重筑作事”,颁发正在医学影像解决顶级邦际集会MICCAI上。并正在2000众篇投稿论文的较量中脱颖而出,斩获青年科学家奖,成为该奖项中的独一华人团队。

确信他的学术效率,可能让虚拟手术项目加快落地,从而让年青大夫尽速滋长起来,承接日益扩充的手术量。正在沈为看来,AI正在医疗影像、虚拟手术上的使用,希望治理城乡医疗资源不屈衡的瓶颈。

异日学家雷蒙德·库兹韦尔曾正在《奇点邻近》一书中预测,异日某个时点,高度富强的呆板智能将与人类文雅彼此协调,对现有文雅、科技体例出现庞杂改良,乃至助助人类超越生物限定性,即所谓的“AI奇点论”。

正在沈为看来,GPT、SORA的横空出生恰巧诠释,异日会有更重磅的推倒性科技倏地显现,且这个时点或许比大都人遐念的还要近。但他更倔强以为,依托于冯·诺依曼底层道理的现有人工智能,无法通过扫描、存储、拜望的形式出现媲佳人类的呆板智能,许众合系的阴谋论是鳃鳃过虑。

“人类头脑的运转机制,和现有人工智能模子有素质区别。咱们的大脑能用不到一个电灯胆的低能耗,落成人工智能须要上万瓦能耗的职司。”

从沈为的叙事中不难推导,许众将AI与人类智商类比的说法都极不厉谨。但这并不影响AI正在特定范围为人类办事,只是须要墟市参加者加倍务实去取长补短。

以盘算推算机视觉为例,沈为以为行业最大的痛点是“盘算推算机视觉编制的精度无法确保100%,因而许众场景下只可阐扬辅助影响。”包含当下大火的Sora,他看好其正在广告营销、逛戏动画、虚拟人创制等目标的阐扬。但这类模子也会历久受到物理纪律认知不敷、AI幻觉的影响,无法正在威厉场景胜任。

“叙话是人类成立的高度精练的外达,每个单元都独立存正在,具有离散性,更易天生通用模子。但自然界的图像却是延续的,因而具有通用智能的盘算推算机视觉编制,至今没有被研发出来。正在治理的确题目时,咱们要遵照使用场景去一个个打制笔直模子,异日的趋向也必定会从纯视觉转向众模态。”

纵使晓畅盘算推算机视觉的“天才不敷”,沈为仍然采选脚结壮地,用历久主义的斟酌立场去治理实质题目。他叙到,做斟酌惟有材干和资源远远不足,还须要“头铁”。

“就像深度练习三巨头,1986年就有了斟酌雏形,然则受限于阿谁硬件不可熟的年代而寂寞许久,许众年后才比及GPU的产生。可睹,有庞杂影响力的斟酌效率,都须要不计时分本钱的强健意志力来支持。”

固然自身是个确信“对峙失事迹”的学者,但他也勉励邦内众余力的团队、贸易公司踊跃斟酌外洋优秀案例,起码能以跟从计谋做到“不落伍”。“GPT也好,Sora也罢,很难说异日会不会演造成卡脖子式的手艺,因而应当对相像新物种连结敏锐。”

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号