第633章 ImageNet挑战赛开启,赛制堪比天梯排位(1 / 1)

时间进入2009年12月中旬。

墙上的电子挂钟跳到上午十点整。

对于写字楼里的上班族来说,年底只意味着写不完的年终总结。

但对于京城邮电大学计算机系教研室里的人来说,今天是个大日子。

郭长征站在电脑屏幕前。

楚一航坐在椅子上,右手握着鼠标,左手习惯性地搓着下巴上的络腮胡。

旁边站着研究生钟柏、江深和叶言。

电脑浏览器上,ImageNet视觉识别挑战赛的官方网站正式开放访问。

楚一航点击刷新按钮。

原本只有倒计时的页面瞬间变了模样,深蓝色的导航栏加载出来。

赛题和规则文档链接出现在页面正中央。

钟柏赶紧凑近屏幕,指着其中一行英文。

“上面说,开放了一百二十万张图像,作为训练集?这数据量有点离谱吧。”

楚一航摸了摸下巴。

“以前的视觉识别比赛,搞个几万张图片就算顶格配置了。”

“这次一上来就直接放出百万级别的数据集,跨度太惊人了。”

“主办方这明摆着是鼓励大家别走寻常路,逼着所有参赛队伍去点新的科技树啊。”

“而且这是明示大家,要用GPU去处理图片,传统的CPU干冒烟了,也处理不过来这么多图片。”

叶言在旁边点头赞同,补充说明。

“确实,要是继续用传统的老算法去跑这百万张图像的特征,算到比赛结束都跑不完第一轮。”

“除了训练集,还有五万张验证集图片,这部分是带标签答案的,是让方便我们对自己的模型,先内部评估一下。”

“算是模拟试卷。”

楚一航继续往下念规则。

“十五万张测试集图片,答案不公开。”

“这就是这个比赛真正的考题了。”

“我们需要用自己的算法,预测这十五万张测试集的标签,然后上传到官网。”

郭长征看着比赛周期说明。

“比赛为期三个月,到明年3月15日截止。”

钟柏指着“UplOad”按钮旁边的一行小字。

“这上面写着,比赛期间可以随时提交预测结果。”

“官网会根据提交的结果,动态更新每个团队的当前排名。”

叶言愣了一下。

“实时排名?还能这样玩?”

楚一航乐了,拍了拍大腿。

“这哪是搞学术,这纯纯是网游里的天梯排位赛啊。”

钟柏也跟着分析。

“以前的学术比赛,都是大家蒙头搞几个月。”

“最后一天统一提交,组委会再花几天时间评阅,最后放榜。”

郭长征思索着这种新赛制带来的变化。

“实时更新排名,意味着所有参赛队伍都能看到别人的进度。”

“这就倒逼着大家一刻不能停,只要被人超了,就得继续优化模型重新跑。”

叶言接着念规则。

“整个比赛期间,每个账号最多只能上传五次预测结果。”

“最终成绩,取五次中得分最高的那一次。”

楚一航啧了一声。

“五次机会,这不就是排位赛里的保级赛机制吗?用完就只能干瞪眼看别人上分了。”

钟柏继续看排名机制的具体算法。

“榜单分为TOp-1正确率和TOp-5正确率两个实时排名。”

楚一航看着那两条榜单规则,直接乐了。

“这赛事主办方也太懂年轻人了,硬生生把沉闷的学术比赛做出了电子竞技的刺激感。”

叶言在一旁兴奋地搓了搓手。

“确实有意思,以前搞研究只能自己一个队伍闷头死磕代码,毫无互动可言。”

“现在搞出实时排行榜和提交次数限制,直接变成了全网极客在线大乱斗。”

钟柏的胜负欲完全被勾起来了,声音都不自觉地拔高。

“这么一来,咱们上传成绩的时间节点就非常讲究了,还得跟全世界的其他队伍玩心理战。”

郭长征看着几个干劲十足的年轻人,笑着点头。

“这种赛制把竞争完全摆在明面上,确实能最大程度逼出大家的好胜心。”

楚一航双手在键盘上快速敲击了两下,眼神里全是跃跃欲试。

“那还等什么?我已经迫不及待想下场,好好蹂躏他们了。”

……

至于为什么这次比赛的赛制,会如此有意思,还要说回两周前。

远在魔都的高档写字楼里。

英伟达中国大区总经理张建忠的桌面上,放着ImageNet赛事的最终赞助确认书。

秘书小刘站在办公桌对面,正在汇报赛事的媒体宣发情况。

“张总,ImageNet官网已经按照我们的要求,把实时排行榜功能上线了。”

张建忠翻看着文件。

“李飞飞教授那边没再提出什么异议吧?”

小刘摇头。

“没有。他们团队的资金缺口很大,亚马逊的众包标注平台收费很高。”

“我们这笔赞助解了他们的燃眉之急,对于赛制修改的要求,他们全盘接受了。”

张建忠拿笔在文件上签下名字。

实时排行榜这个点子,就是他本人向总部提议,并要求加进ImageNet比赛里的。

传统的学术比赛太过沉闷,圈外人根本不关心。

既然英伟达赞助这次比赛的核心诉求就是热度,那就需要一种能让媒体持续报道、能让参赛者产生焦虑感和竞争欲的机制。

排行榜就是最好的焦虑制造机。

为了放大这种竞争欲,英伟达不仅赞助了赛事运营,还单独设立了三万美元的冠军奖金。

小刘提出一个疑问。

“张总,官网还开通了论文和代码同步公开的功能。”

“这也是我们提的诉求。”

“您就这么确信,排在前面的队伍,会用我们英伟达的CUDA架构吗。”

张建忠靠在椅背上。

“这不需要确信,这是概率学。”

“目前市面上能提供大规模并行计算能力,且被学术界广泛接受的,就只有我们的显卡。”

“高校那些传统的图像特征提取算法,处理几千张图片还行。”

“面对一百二十万张的庞大数据集,传统的CPU计算模式根本跑不动。”

小刘接着问。

“万一有人用AMD的显卡呢?”

张建忠笑了笑。

“硬件只是躯壳,生态才是灵魂。”

“AMD没有CUDA这样成熟的底层调用架构。”

“研究员拿了AMD的卡,连最基础的矩阵运算库都要自己从头写。”

“三个月的比赛时间,光写底层代码都不够,还比什么赛?”

小刘翻开手里的另一份简报。

“那盛夏科技前两个月推出的那个九章计算平台呢?”

张建忠听到这个名字,手指在桌面上敲了两下。

“九章确实是个变数,它能兼容AMD的硬件。”

“但一个推出才两个月的新平台,很多高校的老师,甚至都没听过它的名字。”

“研究员们习惯了我们英伟达的工具链,谁会冒着比赛失利的风险,去踩一个新平台的坑?”

张建忠对目前的局势判断非常清晰。

英伟达通过几年的高校赞助,已经完成了用户习惯的初步绑定。

这三万美元的奖金,就是用来收割这批高校用户的成果的。

只要前几名使用了CUDA并在官网上公开技术论文或者源码,那就是对英伟达最好的免费广告。