从情感分析到用户画像,CCF大数据与计算智能大赛 作品源码资料整理

2018 年 3 月 8 日 数据挖掘入门与实战

 向AI转型的程序员都关注了这个号👇👇👇


大概的调研情况如下:

比赛官网 http://www.datafountain.cn/#/home


比赛主要涉及大数据与人工智能领域,这是比较新的领域,这个比赛的先进性以及后期的发展潜力是毋庸置疑的。其次,比赛的出题企业也是非常优质的。去年的主办方邀请了国家电网、蚂蚁金服、搜狗这种重量级的企业,可以体会到比赛坚强的后盾和企业对于这个比赛的巨大期望。最后,在比赛的规模与影响力方面,这个比赛用了仅仅三四年时间已经可以号召近3万的用户,并且基本全部为计算机行业的数据人才,可以看出这个比赛的磅礴的生命力。所以这个比赛还是很值得参加的。(单单从奖金来看,也很具有诱惑力)



0)基于主题的文本情感分析 赛题


 以网上电商购物评论为例,原始的主题模型主要针对篇幅较大的文档或者评论句子的集合,学习到的主题主要针对整个产品品牌;而现实情形是,用户评论大多针围绕产品的某些特征或内容主题展开(如口味、服务、环境、性价比、交通、快递、内存、电池续航能力、原料、保质期等等,这说明相比于对产品的整体评分, 用户往往更关心产品特征),而且评论文本往往较短。

       本次大赛提供脱敏后的电商评论数据。参赛队伍需要通过数据挖掘的技术和机器学习的算法,根据语句中的主题特征和情感信息来分析用户对这些主题的偏好,并以<主题,情感词>序对作为输出。


GitHub https://github.com/digfound/CCFCompetition



1)O2O 赛题
wepon、天音和charles提供的CCF O2O比赛第一名的全套代码和资料:
https://github.com/wepe/O2O-Coupon-Usage-Forecast

2)农产品价格预测赛题
CCF农产品价格预测线上rank2代码
https://github.com/xing89qs/CCF_Product

线上第5,决赛答辩逆袭为第1名的团队
https://github.com/ziminghuang/futuredata-ccf2016

复赛第35名的团队:
https://github.com/wqlin/ccf-price-prediction

3) 客户用电异常行为分析
线上第4名的代码。这个队伍非常强悍,只提交很少的几次,而且最后3天都没提交,还一直前5名。同时,他们还是搜狗比赛的二等奖。
https://github.com/AbnerYang/2016CCF-StateGrid


本文来自 微信公众号 datadw  【大数据挖掘DT数据分析】


4)搜狗的用户画像比赛
线上第3名的TNT_000,同时也是上面客户用电异常行为分析比赛的二等奖。
https://github.com/AbnerYang/2016CCF-SouGou 

线上第5名的The Right队伍的代码和决赛答辩PPT,而且他们还给出了数据下载地址,大赞。同一个团队的几个人分别开源了,链接如下:
https://github.com/dhdsjy/2016_CCFsougou2
https://github.com/dhdsjy/2016_CCFsougou
https://github.com/prozhuchen/2016CCF-sougou
https://github.com/coderSkyChen/2016CCF_BDCI_Sougou

复赛第14名的团队:
https://github.com/admu/CCF_sougou

5)联通的用户轨迹赛题
利用运营商用户数据,提供互联网金融领域内的创意数据产品方案https://github.com/xuguanggen/2016CCF-unicom

6)Human or Robot

决赛第6名
https://github.com/pickou/ccf_human_or_robot


人工智能大数据与深度学习

搜索添加微信公众号:weic2c

长按图片,识别二维码,点关注



大数据挖掘DT数据分析

搜索添加微信公众号:datadw


教你机器学习,教你数据挖掘

长按图片,识别二维码,点关注



登录查看更多
8

相关内容

狭义的情感分析(sentiment analysis)是指利用计算机实现对文本数据的观点、情感、态度、情绪等的分析挖掘。广义的情感分析则包括对图像视频、语音、文本等多模态信息的情感计算。简单地讲,情感分析研究的目标是建立一个有效的分析方法、模型和系统,对输入信息中某个对象分析其持有的情感信息,例如观点倾向、态度、主观观点或喜怒哀乐等情绪表达。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
电力人工智能发展报告,33页ppt
专知会员服务
120+阅读 · 2019年12月25日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
94+阅读 · 2019年12月13日
六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文
专知会员服务
37+阅读 · 2019年11月3日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
干货 | 各大数据竞赛 Top 解决方案汇总
AI科技评论
12+阅读 · 2018年11月12日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
天池大赛—商场中精确定位用户所在店铺 作品分享
数据挖掘入门与实战
3+阅读 · 2018年3月16日
百度魅族深度学习大赛初赛冠军作品(图像识别.源码)
数据挖掘入门与实战
5+阅读 · 2018年3月9日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
Arxiv
34+阅读 · 2019年11月7日
Arxiv
26+阅读 · 2019年3月5日
Arxiv
7+阅读 · 2018年8月21日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
电力人工智能发展报告,33页ppt
专知会员服务
120+阅读 · 2019年12月25日
 【中科院信工所】社交媒体情感分析,40页ppt
专知会员服务
94+阅读 · 2019年12月13日
六篇 CIKM 2019 必读的【图神经网络(GNN)】长文论文
专知会员服务
37+阅读 · 2019年11月3日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
相关资讯
干货 | 各大数据竞赛 Top 解决方案汇总
AI科技评论
12+阅读 · 2018年11月12日
Twitter情感分析及其可视化
数据挖掘入门与实战
21+阅读 · 2018年3月20日
天池大赛—商场中精确定位用户所在店铺 作品分享
数据挖掘入门与实战
3+阅读 · 2018年3月16日
百度魅族深度学习大赛初赛冠军作品(图像识别.源码)
数据挖掘入门与实战
5+阅读 · 2018年3月9日
【大数据】如何用大数据构建精准用户画像?
产业智能官
12+阅读 · 2017年9月21日
Top
微信扫码咨询专知VIP会员