世界第一 范特“纵望大模型”斩获国际计算机视觉顶级赛事双项冠军

2024-09-23 12:27:00
aiadmin
原创
212

2023年10月28日,由邦际出名筹算机视觉运用顶会WACV举办的第二届行人属性识别(Pedestrian Attribute Recognition,PAR)寻事赛完竣已毕。范特科技算法团队依托“纵望”视觉大模子正在大赛中获取优异成效,遥遥领先于AI独角兽和实行室等来自全邦各地的100余支参赛部队,以伟大上风斩获WACV2024 PAR寻事赛的双赛道冠军。

本次大赛旨正在擢升呆板练习算法面临情况产生变更后闪现的未知题目的打点判定才气,为此后的长远商酌供给目标。微软与斯坦福大学协同设置的合股公司CodaLab对此次赛事予以了肆意支柱,助力促进筹算机规模时间继续进取。

此次大赛共包含开采和测试两个赛道阶段,正在开采赛道阶段(9月13日-10月15日),参赛者需求针对真正监控摄像头场景下行人的12种属性40个种别展开众标签分类,好比对行人的年齿、性别、发型、上衣颜色和式样、背包、眼镜等内容举行识别分类。参赛部队正在主办方规章的陶冶集进取行陶冶,然后操纵模子正在标签未知的测试集进取行推理判定,结果依照测试集上的mA和Inst_F1的数值取均匀,动作该赛道的结果得分。

范特科技参赛团队于邦庆节后列入开采赛道,依托“纵望”视觉大模子正在短期间内火速蒸馏出图像分类模子Swin Transformer-Base,这种构造能够更好地捉拿图像的片面和全体消息,从而普及模子特质识别机能。最终范特科技获取0.8945的高分,以领先第二名3个百分点的显然上风斩获该赛道冠军。

正在测试赛道阶段(10月16日-28日),赛事将之前假设的陶冶集和测试集来自统一概率散布(Independent and Identically Distributed,IID)的情形,拓展为现实场景中纷歧律的散布(Out-of-Distribution,OOD),识别难度明显擢升。测试鸠合的行人正在辉煌、视角、种族等方面的现实情形,与陶冶集的内容存正在较大不同,这就容易导致基于陶冶集优化取得的模子,正在现实测试集上的机能降低,低落了模子正在现实运用中的平静性及牢靠性。

范特科技参赛团队依靠众年来正在工业界积蓄的深邃的模子跨域调和时间,从算法和数据两个层面临模子举行改良优化,凯旋抑制潜正在现实机能低落的危险,以0.7183的高分斩获该赛道冠军,跨越上一届冠军2个百分点。

范特科技正在本年第三季度落成了“纵望”说话大模子、视觉大模子和众模态大模子的1.0陶冶版本。动作MaaS平台的时间底座,“纵望”不妨以场景微调、学问蒸馏等体例,寻常赋能金融、安防、文旅等笔直规模运用场景,供给数据合成、数据搜集、算法自陶冶、运用自界说和安置运维主动化才气,助力客户数智化转型。

此次,范特科技依托“纵望”视觉大模子斩获邦际大赛双赛道冠军,进一步印证了“纵望”特质提取才气以及zero-shot练习才气等方面,正在科技革新规模已处于全邦领先名望。

范特科技高度着重时间研发才气修立,异日将会接连列入筹算机视觉(CV)、自然说话打点(NLP)、众模态等时间规模的邦际赛事,正在练习推行中继续擢升和完满范特科技时间产物系统,用AI 2.0时间重塑AI 1.0工作,为修筑中邦式摩登化庞大的时间根本而不懈勉力。

WACV是指IEEE Winter Conference on Applications of Computer Vision,即IEEE冬季筹算机视觉运用聚会。该聚会自2008年初步举办,是一个笃志于筹算机视觉运用方面的聚会。其余,WACV是CVPR、ICCV以及ECCV之外的一个筹算机视觉顶会,被寻常以为是该规模中的苛重聚会之一。返回搜狐,查看更众

联系我们
联系人: 王先生
电话: 15640228768
微信: 1735252255
地址: 沈阳市铁西区兴华南街58-6号