“城市交通拥堵问题因素分析,”赛题十分实用,所有参赛队伍会根据主办方给定的数据自行数据清洗和分类,并且最终能绘制出相关模型,找出影响一个城市交通拥堵的主因素和次因素,并根据数据结果提出相应对策。
很明显,这是一道商业应用赛题,可能也是主办方的几家相关企业在开发产品的过程中需要解决的。如果后面参赛选手能够提交非常精确的分析结果以及合理的方案,那么这个比赛对于解决实际问题还是非常有意义的。
比赛分为预选赛和决赛两个赛段,分别为期1周和2周。在预选赛参赛阶段,参赛队伍需在规定时间内完成数据处理和分类,并找到主因素,建立合适的模型,这个赛段会淘汰掉数据不合格,主因素不对,模型不合适的队伍。
决赛阶段会给参赛团队提供更多时间完善模型、完善相关因素分析,直到找到所有的影响因子并且根据主次提供相关方案。
“数据量非常大而且杂,前期的数据处理工作会有一些困难,费时间,”陆婉下载完数据包以后,在群里做了一个初步判断。
“没关系,就这个赛题而言,前期的数据处理工作倒是最关键的,我们4个人一起把这个阶段工作做好。”吴拜很有信心地给大家提供了方案。
“数据虽然杂,但是主办方已经做好了标记,我们先来把数据查漏补缺做分类吧。”吴胜提议到,认真的时候,吴胜也像那么回事。
林芮和陆婉需要先把数据过了一遍,查漏补缺,紧接着交给吴胜做分类和验证。
虽然已经知道这次的数据包量非常大,打开陆婉发给自己的数据包时,林芮还是比较惊讶,对于一个数据圈入门没多久的新人,这个任务难度确实有些大,然而,对于林芮难说,越是艰难的任务,她便越是想好好挑战。
“你没问题的,我相信你,林芮,”陆婉在微信给林芮打气。
“嗯,我保证努力完成任务,谢谢你的鼓励。”有陆婉的信任和鼓励,林芮没有太多畏难和犹豫,低头投入了茫茫的数据之海中。
其实有了林芮第一轮的清洗,数据已经很干净了,只是关系到后面模型分析结果的准确性,林芮需要再仔细检查有没有错误的数据需要修正或者剔除,有没有缺失的字段等等。
一直到第二天中午,林芮熬了一个通宵,中间饭了忘了吃,水也没沾一滴,等检查完最一串数据,林芮又重新从头到尾翻了一遍,这才谨慎地把数据包传给了吴胜。
“辛苦了,菜鸟,”微信另一头,吴胜又嘻嘻哈哈地调侃了下林芮。“没想到你这速度还可以啊,我以为起码还得一天才轮得到我接手呢。”
“哈哈,会有那么一天,你不会再叫我菜鸟的,”林芮不服气地打了个哈哈。
“嗯,孺子可教,”吴胜欠揍的继续调侃,“现在从态度上看,确实不太像菜鸟。”
“......”要是知道吴胜住哪,林芮真想爬着网线过去把他狠狠揍一顿。
吴拜在群里告诉大家作品已经提交的时候是在预选赛截止的前一天,大家稍稍把心都放了放。
等到预算赛结果出来那天,几个人的系统消息提示都是“您队伍的赛题方案已已经通过预选!”大家才彻底放下来心来。林芮跑去官网翻了翻数据,通过预选的队伍只有600支,记得上次看到的报名数据是8000多支队伍啊。看来这次比赛的难度确实要比上次高。
而接下来决赛阶段的工作十分关键。
第十二章 捷报频传(2/2) 点击下一页继续阅读。