2013年的暑假,距离比赛开始时间还有大约一个月的时间。
“模型的训练过程需要将所有的权重,数据和许多中间过程都放入GPU中进行处理。
因而GPU的显存大小格外重要。”
孟繁岐叹了口气,“即便是我们购买的旗舰690,也太小了,只有4G大小。”
比起后来被美国禁止卖给华国的A100-80G,690不说其他性能,单显存就少了20倍。
孟繁岐如今只能可怜巴巴地每次使用16张图片对模型进行迭代。
“一次十六张,一次循环要接近一百万次才能更新完整个数据集。
而想把模型收敛好,上百次循环又是少不了的。”
孟繁岐估算了一下,这个版本出一次结果要接近20天,最后的训练过程确实大概消耗了三周左右以收敛到现在的这个性能。
好在IMAGENET在后来基本成为了每个算法工程师必调参的练手数据集,孟繁岐自己就曾无数次刷榜,自然是轻车熟路,清楚各类参数的大概设置。
这为他至少节省了一两個月的珍贵时间。
即便一次训练需要三周之久,孟繁岐却仍旧赶在比赛开始之前就已经准备好了一版模型。
看着训练出来的模型最终性能达到了预期,孟繁岐心中的一块大石总算落地了。
这几个月来,他唯一担心的一件事情就是多年前的老框架会出一些他意料之外的问题,导致最终的结果不能和理论预期吻合。
一旦这种事情发生,找到问题所在并测试解决的代价就太大了。
倘若不能够及时解决,会很大影响到他初期的规划。
眼下的结果大约在4.9%的top-5错误率,这个版本比后世论文中的性能要稍差了一丁点,但好在仍旧强于赛事方给出的人类标准了。
一般来说,比赛前是不会公布比赛所使用的具体数据的。
只是IMAGENET比赛比较特殊,一千多万量级的图片,总不可能办一两次比赛就舍弃掉,不再使用。
因而每届比赛所用的数据是变化很小的,只是具体赛道,所竞争的内容和评判的方式常会有所调整。
虽说IMAGENET休赛的时期其实也可以提交结果,孟繁岐现在就可以把这个结果上传上去,夺取第一的位置,但关注度毕竟不可与赛时的激烈竞争同日而语。
();() 与此同时,唐璜也终于开始意识到事情的走向已经远远偏离了他的预料。
“我记得之前查到AlNet在这上面的准确率不到85吧,你现在这个已经特么超过95了啊。”
唐璜第一次来查看结果的时候完全不敢相信这个事实。
“你确定没搞错?别忽悠兄弟啊。
兄弟书读的少,很容易被骗的。”
唐璜此刻的心态很复杂,很希望这是真的,但由于事情实在显得太美好,反而很难相信。
“是假的,我骗你的。”
孟繁岐翻了个白眼,“我加了特技,里面都是化学的成分。”
“不会吧,我亲眼看这性能一路上收敛上来的。”
唐璜又翻了翻模型训练的日志,声音之中带了三分委屈。
他刚刚已经在脑补自己抱紧大腿,走上人生巅峰的场景了。
这就是患得患失的可怜人啊,不敢相信,却又害怕是假的。
“虽然我没有测试集的真实答案,但是我从训练集里划了百分之5出来没有使用,作为验证的办法。”
孟繁岐对这个数据集的方差可以说是了然于胸,95%的数据用于训练,5%的数据用于测试已经是相当稳妥而保守的比例了。
“也就是说,只要这百分之5的数据和测试集的数据差别不大,你的办法可以比去年的冠军强十个百分点?”
唐璜仍旧还处于极度的震撼当中。
制霸各大奖项的国民影帝突然冒出来一个女儿,粉丝柯南上线,将这个便宜女儿直接扒皮。打架斗殴,抽烟喝酒,初中辍学,爱慕虚荣,可谓当代青年的负面典型,集所有败德于一...
苏柳叶穿越了,穿成死了夫君的美艳小寡妇。外面的野男人对她虎视眈眈,家里还有个整日欺负她的恶婆婆。为了活下去,苏柳叶决定把自己送给村里唯一的猎户。只因那猎户长得俊,身体壮,家里还有两个奶萌奶萌的小崽崽,看着好想rua。猎户楚衍性格软,身子弱,怕是遭不住。苏柳叶遭得住遭得住!我脑子灵光运气好,浑身有的是力气,你尽管使唤折腾。猎户眸子一亮这可是你说的?苏柳叶???总感觉哪里不对劲。直到她下不了床...
...
林宜上辈子是个脑子不太好的,她爱得死去活来的男人谋她家财害她性命,她甩了三巴掌的男人却成为众人仰望求着供着的大人物,高攀不起的她死于他的床上。重活一世,她总算活明白了,害她的她要全部报复回来,至...
狱中讲课,朱棣偷听后求我当国师见证了靖难之役结束,作为诛十族对象的姜星火终于松了口气。身为资深穿越者,九世穿越即可回现代永生。自觉马上大功告成的姜星火,无聊到开始在狱中讲课,但似乎渐渐不对劲了起来马三宝海权论里的大航海时代是什么?姚广孝国运论竟然是传说中的屠龙术!朱高炽华夏货币史的银本位没讲完呐。姜星火我明天就要砍头了,剩下的课托梦给你们讲吧。这时,诏狱的墙壁轰然倒塌,一个声音传来。姜先生,朕是朱棣,求您当国师吧!...
奇怪的声音不断响起,忍无可忍的洛羽在不堪纠缠的情况下意外绑定了一个炮灰逆袭系统,从此踏上了不断穿梭于各个位面的道路。不管你是家暴凤凰男还是矫揉造作白莲花,亦或是口蜜腹剑黑心莲,且等我手撕逆袭。...