邀你体验Datacastle国际大师赛

DC数据城堡 发布于 2017/07/24 14:15
阅读 27
收藏 0

【Gopher China万字分享】华为云的Go语言云原生实战经验!>>>

 

     流言蜚语中,我们如何找到谣言传播的引爆源?传染疾病肆虐,我们如何搜索超级传播者?金融危机中,如何发现风险的源头?......

      为了进一步探讨以上问题,数据科学竞赛平台DataCastle于6月13日推出一场面向全球数据爱好者的竞赛——DataCastle国际大师赛,主题为探索复杂网络中的关键节点。截至目前,这场规模空前的比赛已经吸引了了国内外400余参赛者加入,主办方仍着力邀请国内外更多对复杂网络领域兴趣浓厚并有着深入研究的学者及团队参与其中。

      作为国内最大的开源技术社区,我们深知开源中国200万的用户群一定是卧虎藏龙,所以也许你有兴趣参与到这场大师间的对决。

      大师赛意在更深入的研究复杂网络的优化渗流,由DataCastle堡主、大数据权威学者周涛教授亲自策划赛题,并力邀渗流领域的国际顶级科学家成立大赛学术委员会(Academic Board Member,简称ABM)对大赛进行学术指导。

      目前,ABM名单包括微软亚洲研究院高级研究员、清华大学客座教授、中国科学院计算所客座研究员陈卫;中科院百人计划、中科院理论物理研究所研究员周海军;东京工业大学创新研究所特任教授、成均馆大学能源科学系教授Petter Holme;纽约市立大学物理博士Flaviano Morone;美国物理协会会员、纽约市立大学教授Hernan Makse等。  

     大师赛面向全球数据极客同步开放,最终Top50的竞赛团队将有机会进行访问交流、与ABM深度合作。

大赛简介

       社交网络以及其他各种各样的网络,在社会经济、自然科学等领域中发挥着越来越大的作用,而其中一个很核心的问题是了解一个节点在网络中发挥的作用。比如SARS的传播,可能香港一个超级传播者带来的影响比其他100甚至1000个人还多;一条谣言的传播,一个核心大号的转发可能带来巨大的影响。   因此需要我们有一种能力,可以从生物的大规模基因调控网络中,找到导致疾病的重要基因;从大规模的社交网络中,找到传播谣言/疾病的最重要的节点;从大规模的企业投资关系网络中,找到可能导致金融风险的重要企业。

      这些零零总总都可以划归为一类问题:如何寻找网络中的关键节点,这实际上是从现在到未来最有可能导致商业模式革新的一个重要方向。这个问题,也叫做复杂网络最优渗流,是网络科学领域的一个经典问题。本次大赛聚焦于此,邀请国内外顶级专家学者合作指导,以期获得精准的算法结果和优美的解决方案。

大赛数据与任务

      本次大赛共提供8个无向网络数据,平均规模超过100万。其中有4个真实网络,分别是自治系统网络、万维网、道路交通网络和社会网络;有4个模型网络,其构建机制各不相同 对于每一个网络,参赛者都需要对其节点的重要性进行评估。 具体来讲:根据某种规则将节点排序,然后按序将节点从网络中一一删除,每删除一定数目的节点,便统计剩余网络的最大连通集团的规模;最大连通集团的规模减小得越快,就说明对于节点重要性的识别方法越优秀。

大赛奖励

①与ABM成员论文合作

-互选成功启动双方论文合作

②学术访问交流

-接受ABM成员学术访问邀请并前往科研机构进行学术交流

③ABM特邀礼品

-ABM晚宴邀请函  

-ABM签名礼品

大赛赛程

①自主提交阶段(2017.6.13-2017.10.15)

        自主提交阶段,参赛团队可以自主在DataCastle平台提交竞赛结果,得到对应的评分和排名。

②实验报告阶段(2017.10.16-2017.10.20)

        DataCastle平台排名前50名的参赛团队有资格提交实验报告,获得进入顶级专家阶段的机会。

③顶级专家阶段(2017.10.20-2017.11.19)

        进入顶级专家阶段的参赛团队,可与本次大赛的Academic Board Member成员进行互选,由DataCastle组织实验报告对接,双方均有兴趣的情况下,将启动论文合作和访问交流。

④成果展示阶段(2017.11.28)

        在DataCastle年度峰会上,将邀请互选成功的顶级专家和参赛团队展示研究成果并现场颁奖(具体数量根据互选结果确定)

平台简介

      作为中国知名的数据科学竞赛平台,DataCastle长期致力于通过参赛者参赛提供的算法和策略解决社会各个领域的难题,目前已有超过30000名数据科学从业者与学习者注册。大多数参赛者都是物理、计算机领域经验丰富的研究人员。平台目前已成功举办了金融、交通、天气、人力资源等领域的20余场大数据竞赛,为机器学习、复杂网络分析、趋势预测、关系挖掘、图像识别、数据可视化等主流的数据科学问题的实际运用提供了更好的算法和解决方案。 我们已知现有的挖掘关键节点的方法包括结构化的指标(度、H指数、核数、接近中心性、介数中心性、Katz中心性)、迭代寻优(特征向量中心性、累计提名、PageRank、HITs)、节点移除/收缩(最短距离法、生成树法、残余接近中心性、节点收缩法)、以及基于动力学的研究(路径统计的方法、时间敏感的方法)等。 我们相信,仍有更好的方法等待我们去挖掘。 40亿年前产生单细胞生物,3到4亿年前出现智慧生物,400万年前出现智慧的人,历史的车轮将我们推向科技的风口浪尖,数学、物理、计算机三种思维方式作为推动科技进步的原动力期待着不断地被探索和发现。 DataCastle国际大师赛抛出一道综合了三种思维方式的科学难题,我们期待通过这次研究性比赛,涌现出一批优秀的参赛团队,寻求最前沿且精确结果,足以让这个星球上最顶尖的科学家都为之震撼。 更希望通过这次竞赛发现一些“优美”的解决方案,找到一种结合数学、物理、计算机的最精髓的办法,为这道经典难题交出一份迄今为止最美丽的答卷。

      开源中国的大神们,是时候展现真正的技术了。

加载中
返回顶部
顶部