不忘初心,砥砺前行——写在数据院成立四周年之际

2018 年 4 月 18 日 数据派THU


[编者按] 在一个寒冬的下午,我来到位于清华紫荆门附近的双清大厦,数据科学研究院就坐落在此。那是我加入数据院的第一天,印象尤为深刻。深刻的并非是某件事情,而是一个令我有些措手不及的小任务:在数据院成立四周年之际,写一组关于数据院的报道。“你之前是记者,希望你能带着自己的观察、自己的思考和自己的体悟,客观地将这些呈现出来。”执行副院长韩亦舜如此说道。于是在随后的日子里,我跟小伙伴们历经百余天,采访了近30位受访者,开始了一段百万文字记录的旅程。

 

自己的故事,家的故事,情理之中,又意料之外。“为何要将自己家的故事说给外人听?”这是我最大的疑惑之处。韩院长用这样一句话回答了我,很具有思考性,因此我把它用作这组文章的开篇:“因为我们的实践,我们的探索或许对别人有启发、有帮助。”

 

此次组稿将分五部分:本篇总稿,教学篇,科研篇,传播篇,数据院建设者剪影,记于清华107年校庆之时,也记于数据院成立四周年之际。

 



毫无疑问,次数最多,时间最长就是对韩院长的访谈。记得最后一次访谈时,夕阳西下,韩院长逆光而坐,我几乎看不清他的脸。采访每一个数据院工作人员的时候,我都会问这样一个问题,那么韩院长也不例外:“听您讲了这么多甜酸苦辣,如果四年前,您就知道会经历这些,您还会选择加入数据院来做这份工作吗?”他沉思了,我猜可能由于情绪太复杂他不知道如何表述,但实际并不是,“我想我还会,因为我想参与其中,为变革做些自己力所能及的工作。”他说道,随后话锋一转。“你爱过吗?”他突然问。

 

我一时语塞,不知该如何作答。

 

“你刚才说到甜酸苦辣,爱一个人,爱一件物,爱一番事业,哪有一帆风顺的?一定伴随着甜酸苦辣。这就是爱与喜欢的区别,如果是真爱,当你回首往事,留下的就都是甜美的回忆。”我在他眼中看到了一束光,这束光的来源是热爱。

 

数据院有正式的办公地点是从2015年1月1日开始的,伟清楼二层一间28平米的房间。2017年7月,数据院搬入了双清大厦,两层楼,时至如今已经又快坐不下了。数据院的迅猛发展,当然是仰赖国家对大数据的重视,大数据成为了热门话题,但也和学校领导在数据院建院之初的设计有很大关系。我想,数据院的故事就从这里讲起吧。

 

2014年4月26日,主楼接待厅,清华-青岛数据科学研究院正式成立。并向社会宣布,培养大数据高层次应用型的人才。采访中我得知了数据院的“前传”。


青岛-清华数据科学研究院成立仪式现场

 

2013年底,清华领导敏锐地认识到大数据时代,清华不应该缺位,应该打造一个平台,把散落在各院系的大数据教学与科研的力量汇聚起来。因此,研究生院承担了前期校内外的调研工作,向校领导提出了建设大数据科研和教学机构的建议。很快,这个建议得到校领导的认可,也得到了青岛市委市政府的支持。

 

数据院和学校里多数的研究机构很不一样。工作节奏快,决策链短,效率高,执行力强。风格上更像公司的运作,颇有种雷厉风行的范儿。而且韩院长还要求数据院所有的人,都能够潇洒自如地对外做数据院的介绍,每个人都能够讲出数据院的四个特点,三大任务。

 

四个特点是:24字工作方针、不挂靠具体院系、请来国际知名的学者做院长、请了职业经理人负责运营,这四个特点大概构成了数据院与全国其它开展大数据工作的高校不一样的地方。说到这,切实体会到了学校当时的用心良苦。

 

24字工作方针,即“学校统筹、问题引导、社科突破、商科优势、工科整合、业界联盟”

 

据知情人士透露,在数据科学研究院筹备组向校领导上报的时候,原本的指导方针只有16个字,时任校长陈吉宁字斟句酌,最终才有了现在的这24字方针。而在学校成立的非实体研究机构中,由学校领导亲自提出工作方针的并不多见。

 

“先社科后商科最后才提工科,24字方针中,这种排列顺序在工科见长的清华大学,很多人不理解。但其实很契合大数据应用的逻辑。对于工科,采集数据,存储、加工数据,挖掘数据是一直在做的事情,但对于社科商科,带来了前所未有的发展机遇,突出社科商科也就是情理之中的事情了。”韩亦舜说。

 

学校一直提倡跨学科交叉融合。但由于体制机制等原因,几经尝试,都不大理想。原因当然很多:建实体机构,等于是对存量资源(编制,办公室等等)进行一个重新分配,会引起很多矛盾。获取增量资源,推动这件事情的可行性会大一些。一旦建了校级实体,它和其他实体就是平行关系,就会回到“不相交”的状况,失去了交叉的可能性,也失去跨学科的机会。


学校曾成立过不少非实体机构,每个机构也都设立的管委会。但由于挂靠了具体院系,管委会和挂靠院系领导班子的角色难以划分。而不一样的是,数据院没有挂靠实体院系,由关心数据院发展建设工作的有关院系领导组成“管委会”。“这很像公司里的董事会,既可以为数据院的发展把握大方向,又不会很大程度上干预数据院的具体运作。”韩亦舜这样解释道。

 

而请来德高望重、著作等身的国际数据管理领域顶尖学者、美国伊利诺伊大学芝加哥分校特聘主任教授俞士纶(Philip S. Yu)教授担任兼职的院长,则可以摆脱技术门派的分歧,把重点放在数据应用上。


国际数据管理领域顶尖学者、美国伊利诺伊大学芝加哥分校特聘主任教授俞士纶(Philip S. Yu)教授受聘清华大学数据科学研究院院长


鉴于教授学者管理研究机构的兴趣与特点,校领导想尝试请一位管过企业的人来参与这个研究院的管理运营工作。因为在国外,很多研究机构,医院等不是‘学而优则仕’,而是由专业管理人员在管理在运营。这就有了韩亦舜执行副院长的加入。


因为这与众不同的四大特点,使得数据院真的“与众不同”。特别是强烈的求生存感和使命感,我想这和有企业背景的韩院长有很大关系。

 

“我常常被学校有关部门批评。我们冲劲大,有时会跑偏,有时会和学校现有的规章制度有冲突。大数据对谁都是个新鲜事物,带来新思维,面临新挑战。有冲突这也正常,相互理解吧。另外,我世界观是在改革开放大浪潮里形成的,改革、创新就是与现有规章有冲突。最后让历史、让实践来检验吧。”韩亦舜院长如是说。

 

数据院的创新与变革远不止这四点,它体现在数据院发展的方方面面,也显示了数据院奠基者们在最初设计时的缜密思考。

 

数据院的三大任务是:教学管理,科研平台和品牌传播。

 

新时代需要什么样的人才,这是数据院人时时在思考的问题。校领导决定清华大数据人才培养,不采用直接面向社会招生的模式,也就决定了必须创新。

 

为了实现跨学科跨领域“π”型人才培养,数据院跳出现有学科建设的思维模式,用“能力提升”这样一个证书项目,面向全校招收在校研究生学生。并在教学环节进行了很多新的尝试。这给授课老师带来了新的挑战,数据院更是一个非教学实体的身份几乎承担了全部的教学管理和经费支持的任务。这在校内外都绝无仅有。数据院聘请了国际知名企业的高管和校内教师一起,组成了大数据教育指导委员会,清华大数据教育也得到了他们的悉心指导。

 

清华大学大数据硕士项目教育指导委员会成立暨第一次全体会议


数据院在科研方面的探索体现在没有以技术路线为导向,而是以应用场景为导向,组织校内相关领域的老师合作。为此先后成立了“工业大数据”、“医疗大数据”、“交通大数据”等科研平台。这些产业应用场景都足够大,甚至可以包容全校的科研力量徜徉其中。


在数据驱动的科研平台建设方面,以“清华医学研究数据平台”搭建工作为例,很难有哪个单一院系愿意做,肩负建设跨学科跨领域交叉融合平台使命的数据院当仁不让地站了出来。数据院还在推动校内老师和长庚医院的医生们结对子,搞科研。有这样一个数据平台就可以真正实现“医工结合”。像数据院推动的司法大数据、舆情大数据向全校的老师和学生开放,也将改变数据驱动的科研生态。


2017年度数据院各研究中心工作交流会


品牌传播这个词在校内很少使用。有“清华大学”这个品牌不就行了吗?所以数据院的有些做法也让很多人不理解。其实,真正的品牌传播应该有深层的内涵,传播品牌实际上传播的是品牌所包含的理念。透过微信公众号“数据派”,公开系列讲座,论坛,思享会持续在业界发出声音,发出清华人特有的理性声音。希望为当下燥热的大数据带来一股理性的“清流”。


自2014年12月始,数据科学研究院“应用•创新”及“技术·前沿”公开系列讲座开始举办,首场演讲者分别为SAS中国区总经理刘政以及时任英特尔(中国)研究院院长吴甘沙。


面对大数据时代所需要的新思维,数据院推出了“RONG”的理念,并在2014年的年底,举办了第一场“RONG”论坛。为此,新闻与传播学院的老师对“RONG”进行了诠释:RONG,取其与“融”“溶”“荣”“容”之谐音,意指“融合”“融洽”“包容”“宽容”“繁荣”“荣光”等,代表了数据研究院成立的某种初衷和理念,故以RONG 之音一言以蔽之。


基于RONG理念建立的RONG基金,不拘一格聘请RONG教授、RONG研究员,发放RONG奖学金;用RONG冠名的大型论坛、峰会又进一步传播了RONG理念。


2016年的统计数字显示,一年间,全校有来自四十余个不同院系的百余位教授学者参加了数据院的活动,这在学校的历史上不多见。这就是RONG。截止到2017年底,三十几个院系的逾千名学生报名参加了“大数据能力提升项目”,数百名学生拿到了“大数据能力提升证书”,这在学校的“能力提升项目”族中,也不多见。这就是RONG。


数据院对社会资源的聚拢能力,也是让其它高校羡慕不已的特色之一。从新春人才交流会到大数据日,从课堂作业到暑期实习,大数据企业与数据院越走越近。由于坚持不懈地走产学研融合的道路,各方都从中尝到了甜头。从当初“请求企业来”到现在“企业请求来”,背后当然是数据院的教师和教学管理者们的辛苦付出。


24字方针中的“问题引导”、“业界联盟”,在数据院得到了具体的实践。2014年11月,数据院联合多家校友大数据企业和社会大数据企业,成立了“清华大数据产业联合会”,后更名为:“清数大数据产业联盟”。数据院的理念与实践得到了企业的认可,大量的实际需求来自企业,让老师及学生得以“根植真环境,直面真问题,挖掘真数据,锻炼真技能。”,也涌现出一批企业导师,产学研真的RONG在了一起。


如此,说回到开篇的“甜”。我在采访中发现,每当讲到苦,大家总是寥寥几句,或者是“嗨这没什么。”而说到“甜”,大家都是滔滔不绝,因为这和他们的事业心、成就感紧密相连。每一次的创新被学校和社会认可,他们甜;每一次的克服困难达成使命,他们甜;每一次的思想碰撞发出耀眼的火花,他们甜;说到苦,他们闪烁泪花,说到甜,他们更是泪花闪烁。难怪韩院长这样说道:“可能所有人最后留下的都是甜美的记忆。”


数据院的四年,勾勒出一条清晰的轨迹。第一步,抓好品牌建设,传播理念,产生社会影响力;第二步,巩固教学管理工作,以适应社会对大数据人才的需求;第三步,着力数据科研平台的建设,推动以科研为目的的数据开放,助力学校大数据科研工作。


面对未来,数据院将不忘初心,继续推动大数据教学和科研在清华的发展。为创新而生的数据院将继续砥砺前行……思维模式的碰撞还会继续,行事风格的差异还会继续。困难一定有,障碍一定有,方法也一定有。


数据院RONG理念


后记:

在采访及撰稿的过程中,韩院长再三嘱咐,在此一定要特别感谢在前台和幕后支持帮助数据院的领导、老师和职能部门的干部、职员;特别感谢与数据院一起共建产学研RONG合平台的企业家们;特别感谢那些认同数据院的理念与实践对数据院包RONG、为数据院担当的人们。因为有了你们,数据院成为了全国高校大数据教育科研机构中的创新者与佼佼者。愿我们继续携手,不忘初心,砥砺前行。


预告:

数据院在科研领域做了些什么?

提起工作,数据总架构师为何不住叹息?

大小假期,科研中心团队为何坚守岗位?

“数据院四周年报道之科研篇”

将在本周五发布

为大家讲述数据院在科研领域的从零到一

敬请关注。

登录查看更多
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
Python数据分析:过去、现在和未来,52页ppt
专知会员服务
99+阅读 · 2020年3月9日
电力人工智能发展报告,33页ppt
专知会员服务
120+阅读 · 2019年12月25日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
清华大学张敏老师,个性化推荐的基础与趋势,145页ppt
专知会员服务
85+阅读 · 2019年11月27日
清华大学两名博士生被开除:你不吃学习的苦,就要吃生活的苦
机器学习算法与Python学习
25+阅读 · 2019年9月16日
DevOps 国际峰会 2019 · 北京站完整实录(附PPT)
DevOps时代
50+阅读 · 2019年7月8日
知乎破8万赞回答:那些厉害的人,思维方式比你强在哪儿?
冬日里的一首歌 | 清华快闪女指挥王明媚讲述背后的故事
清华大学研究生教育
57+阅读 · 2019年1月9日
清研实践|清华深研院师生赴澳洲墨尔本六所高校开展数据科学访问
【深度】谭铁牛院士谈人工智能发展新动态
中国科学院自动化研究所
4+阅读 · 2017年12月28日
Self-Attention Graph Pooling
Arxiv
5+阅读 · 2019年4月17日
Hierarchical Deep Multiagent Reinforcement Learning
Arxiv
8+阅读 · 2018年9月25日
Structure Aware SLAM using Quadrics and Planes
Arxiv
4+阅读 · 2018年8月13日
VIP会员
Top
微信扫码咨询专知VIP会员