【GitHub干货贴】全球数据竞赛Top解决方案开源整理与汇总

2018 年 11 月 12 日 新智元




  新智元报道  

来源:Github

作者:Smilexuhc等

编辑:大明

【新智元导读】想做数据科学家吗?来看看前人大神走过的路吧!本文是来自Github的国内外数据竞赛中Top解决方案总结贴,涵盖NLP、计算机视觉等领域,干货满满哟。


随着AI技术的日新月异,对AI人才的需求也水涨船高,AI技术构建离不开大量的数据。如何处理和利用这些数据,这个艰巨任务就落在了数据科学家的肩上。现在甚至有一种说法,称数据科学家是21世纪最性感的工作。

 

尽管市场需求火爆,但并不是每个人都能成为一名合格的数据科学家。目前各大企业为了网罗数据科学的优秀人才,经常举办形式多样的数据竞赛。在竞赛中常有令人眼前一亮的方案脱颖而出,也为后来人提供了宝贵经验。

 

近日在Github上出现了一份干货资源总结贴,汇总了各大数据竞赛中名列前茅的一些优选解决方案。如果你有志进军AI行业,但对成为数据科学家还有些“心有余而力不足”,相信多看看前人大神的解决方案一定会有所裨益。

 

首先感谢这个总结贴的作者SmilexuhcGithub主页:https://github.com/Smilexuhc,为我们提供了如此全面和精彩的技术干货,目前此贴中的资源还在不断更新中,欢迎各位小伙伴们一起添砖加瓦!


下面就一起来看看这个帖子都分享了哪些精彩内容:

 

数据竞赛资讯内容整理


数据竞赛资讯:

https://github.com/iphysresearch/DataSciComp


ApacheCN 的kaggle资料链接:

https://github.com/apachecn/kaggle 


Kaggle top方案整理:

https://github.com/EliotAndres/kaggle-past-solutions


纯数据竞赛Top解决方案整理


1、2018科大讯飞AI营销算法大赛

Rank1:https://zhuanlan.zhihu.com/p/47807544


2、2018 IJCAI 阿里妈妈搜索广告转化预测

   Rank1:https://github.com/plantsgo/ijcai-2018 
   Rank2:https://github.com/YouChouNoBB/ijcai-18-top2-single-mole-solution 

    https://blog.csdn.net/Bryan__/article/details/80600189 

    Rank3: https://github.com/luoda888/2018-IJCAI-top3 

    Rank8: https://github.com/fanfanda/ijcai_2018 
    Rank8: https://github.com/Gene20/IJCAI-18 
    Rank9(第一赛季)https://github.com/yuxiaowww/IJCAI-18-TIANCHI 
    Rank29: https://github.com/bettenW/IJCAI18_Tianchi_Rank29 
    Rank41: https://github.com/cmlaughing/IJCAI-18 
    Rank48: https://github.com/YunaQiu/IJCAI-18alimama 
    Rank53: https://github.com/altmanWang/IJCAI-18-CVR 
    Rank60: https://github.com/Chenyaorui/ijcai_2018 
    Rank81: https://github.com/wzp123456/IJCAI_18 
    Rank94: https://github.com/Yangtze121/-IJCAI-18-


3、2018腾讯广告算法大赛

    Rank3: https://github.com/DiligentPanda/Tencent_Ads_Algo_2018 
    Rank6: https://github.com/nzc/tencent-contest 
    Rank7: https://github.com/guoday/Tencent2018_Lookalike_Rank7th 
    Rank9: https://github.com/ouwenjie03/tencent-ad-game 
    Rank10: https://github.com/keyunluo/Tencent2018_Lookalike_Rank10th 
    Rank10(初赛): https://github.com/ShawnyXiao/2018-Tencent-Lookalike 
    Rank11:https://github.com/liupengsay/2018-Tencent-social-advertising-algorithm-contest 
    https://my.oschina.net/xtzggbmkk/blog/1865680 
    Rank26: https://github.com/zsyandjyhouse/TencentAD_contest 
    Rank33: https://github.com/John-Yao/Tencent_Social_Ads2018


4、2018高校大数据挑战赛-快手活跃用户预测 

    Rank1: https://github.com/drop-out/RNN-Active-User-Forecast 

    https://zhuanlan.zhihu.com/p/42622063 
    Rank4: https://github.com/chantcalf/2018-Rank4- 
    Rank13 (初赛 A榜rank2 B榜rank5): https://github.com/luoda888/2018-KUAISHOU-TSINGHUA-Top13-Solutions 
    Rank15: https://github.com/sunwantong/Kuaishou-Active-User 
    Rank20: https://github.com/bigzhao/Kuaishou_2018_rank20th 
    Rank28 (初赛A榜rank1,B榜rank2):https://github.com/YangKing0834131/2018-KUAISHOU-TSINGHUA-Top28-Solutions- 
    https://github.com/FNo0/2018-KUAISHOU-Top28


5、2018JDATA 用户购买时间预测
    Rank9:https://zhuanlan.zhihu.com/p/45141799


6、2018 DF风机叶片开裂预警
    Rank2:https://github.com/SY575/DF-Early-warning-of-the-wind-power-system


7、2018 DF光伏发电量预测
    Rank1:https://zhuanlan.zhihu.com/p/44755488?utm_source=qq&utm_medium=social&utm_oi=623925402599559168 
    
https://mp.weixin.qq.com/s/Yix0xVp2SiqaAcuS6Q049g


8、AI全球挑战者大赛-违约用户风险预测
    Rank1:https://github.com/chenkkkk/User-loan-risk-prediction


9、2016融360-用户贷款风险预测
    Rank7:https://github.com/hczheng/Rong360


10、2016 CCF-020优惠券使用预测
    Rank1: https://github.com/wepe/O2O-Coupon-Usage-Forecast


11、2016 ccf-农产品价格预测
    Rank2: https://github.com/xing89qs/CCF_Product 
    Rank35: https://github.com/wqlin/ccf-price-prediction


12、2016 ccf-客户用电异常
    Rank4: https://github.com/AbnerYang/2016CCF-StateGrid


13、2016 ccf-搜狗的用户画像比赛
    Rank1: https://github.com/hengchao0248/ccf2016_sougou 
    Rank3: https://github.com/AbnerYang/2016CCF-SouGou 
    Rank5: https://github.com/dhdsjy/2016_CCFsougou 
    https://github.com/dhdsjy/2016_CCFsougou2 
    https://github.com/prozhuchen/2016CCF-sougou 
    https://github.com/coderSkyChen/2016CCF_BDCI_Sougou


14、2016 ccf-联通的用户轨迹
    RankX: https://github.com/xuguanggen/2016CCF-unicom


15、2016 ccf-Human or Robots
    Rank6: https://github.com/pickou/ccf_human_or_robot


16、菜鸟-需求预测与分仓规划
    Rank6: https://github.com/wepe/CaiNiao-DemandForecast-StoragePlaning 
     Rank10: https://github.com/xing89qs/TianChi_CaiNiao_Season2


自然语言处理类(NLP)


1、2018 DC达观-文本智能处理挑战 

 Rank1:https://github.com/ShawnyXiao/2018-DC-DataGrand-TextIntelProcess 
    Rank4: https://github.com/hecongqing/2018-daguan-competition 
    Rank10: https://github.com/moneyDboat/data_grand 
    Rank18: https://github.com/nlpjoe/daguan-classify-2018 
    Rank X: https://github.com/yanqiangmiffy/daguan


2、智能客服问题相似度算法设计——第三届魔镜杯大赛
Rank6:https://github.com/qrfaction/paipaidai

Rank16:https://github.com/guoday/PaiPaiDai2018_rank16 
Rank29: https://github.com/wangjiaxin24/daguan_NLP


3、2018 JD Dialog Challenge 任务导向型对话系统挑战赛

    Rank3: https://github.com/zengbin93/jddc_solution_4th


4、2018CIKM AnalytiCup – 阿里小蜜机器人跨语言短文本匹配算法竞赛
 Rank2: https://github.com/zake7749/Closer 
 Rank12:https://github.com/Leputa/CIKM-AnalytiCup-2018 
 Rank18: https://github.com/VincentChen525/Tianchi/tree/master/CIKM%20AnalytiCup%202018


计算机视觉类(CV)


Kaggle-TGS
    Rank56 :https://github.com/Gary-Deeplearning/TGS-Salt


一些经验分享


介绍featexp 一个帮助理解特征的工具包 

http://www.sohu.com/a/273552971_129720


Ask Me Anything session with a Kaggle Grandmaster  by Vladimir I. Iglovikov PDF下载:https://pan.baidu.com/s/1XkFwko_YrI5TfjjIai7ONQ


一些大佬的Github
  1. 植物:https://github.com/plantsgo

  2. wepon :https://github.com/wepe

  3. Snake:https://github.com/luoda888

  4. Drop-out:https://github.com/drop-out

  5. 金老师的知乎:https://zhuanlan.zhihu.com/jlbookworm

  6. 渣大:https://github.com/nzc

  7. 郭大:https://github.com/guoday



PS:希望大家star,fork一下

特别感谢金老师对整理比赛开源已做出的贡献,特别是在2016年的ccf大赛中。


分享团队联系方式:

Smile qq:240485545 Email:smile.xuhc@gmail.com 
PUSH qq:1471386635 Email:1471386635@qq.com 
dive2space qq: 1124361357 Email:dive2space@qq.com


资源链接:

https://github.com/Smilexuhc/Data-Competition-TopSolution



【加入社群】


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号:aiera2015_3  入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。



登录查看更多
3

相关内容

【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
【资源】kaggle数据科学竞赛方案集锦
专知
27+阅读 · 2019年9月4日
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
干货 | 各大数据竞赛 Top 解决方案汇总
AI科技评论
12+阅读 · 2018年11月12日
资源 | 开源数据集
AI研习社
8+阅读 · 2018年9月25日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
A General and Adaptive Robust Loss Function
Arxiv
7+阅读 · 2018年11月5日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年4月30日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关VIP内容
【DeepMind推荐】居家学习的人工智能干货资源大全集
专知会员服务
107+阅读 · 2020年6月27日
专知会员服务
59+阅读 · 2020年3月19日
专知会员服务
109+阅读 · 2020年3月12日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
计算机视觉最佳实践、代码示例和相关文档
专知会员服务
17+阅读 · 2019年10月9日
TensorFlow 2.0 学习资源汇总
专知会员服务
66+阅读 · 2019年10月9日
相关资讯
【资源】kaggle数据科学竞赛方案集锦
专知
27+阅读 · 2019年9月4日
CVPR2019年热门论文及开源代码分享
深度学习与NLP
7+阅读 · 2019年6月3日
干货 | 各大数据竞赛 Top 解决方案汇总
AI科技评论
12+阅读 · 2018年11月12日
资源 | 开源数据集
AI研习社
8+阅读 · 2018年9月25日
【资源】史上最全数据集汇总
七月在线实验室
18+阅读 · 2018年4月24日
GitHub上12月份最热门开源项目
程序猿
4+阅读 · 2018年1月9日
相关论文
Adaptive Neural Trees
Arxiv
4+阅读 · 2018年12月10日
A General and Adaptive Robust Loss Function
Arxiv
7+阅读 · 2018年11月5日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
4+阅读 · 2018年5月21日
Arxiv
5+阅读 · 2018年4月30日
Arxiv
11+阅读 · 2018年1月18日
Top
微信扫码咨询专知VIP会员