科研不端、虚假陈述,「木兰」项目负责人被停职检查

2020 年 1 月 19 日 CVer

点击上方“CVer”,选择加"星标"或“置顶”

重磅干货,第一时间送达

本文转载自:HyperAI超神经


内容提要:1 月 15 日,中科院计算所发布国产编程语言「木兰」,令很多人为之一振,纷纷试用。结果,很快就有开发者质疑它只是「换皮 Python」。面对质疑声,项目负责人刘雷已经发布情况说明,并对自己的夸大行为进行道歉。目前,他已被停职检查。


关键词:国产编程语言 木兰 道歉



短短 3 天时间,标榜 国产编程语言「木兰」就经历了重重风波。「木兰」被质疑「换皮 Python」的事件陷入舆论中心,大家应该已经有所了解。

就在今天下午, 中科院计算所对此事做出了回应,已对当事人刘雷做出停职检查的决定,并就管理责任责令编译实验室负责人作深刻检讨。

中科院计算所于 1 月 19 日下午 14:42 分发布了通告

 

从发布到被揭露,仅用 24 小时


1 月 15 日,由中国科学院计算技术研究所(以下简称中科院计算所),计算机体系结构国家重点实验室编译组主导研发的国产编程语言「木兰」正式发布。

发布会上,团队负责人刘雷副研究员
介绍「木兰」编程语言体系研发过程及应用进展

结果,前脚因国产、自主研发而刷爆媒体头条,后脚就引来了质疑,很多开发者下载试用之后 严重怀 疑其「换皮 Python」。

不仅对话框、函数等类似 Python,就连安装包图标
也与 Python「神似」

质疑声愈演愈烈。「木兰」项目的负责人、 中科院计算所计算机体系结构国家重点实验室研究院 刘雷已经在 1 月 18 日进行情况说明并道歉。而此前公布的「木兰」下载地址已经 404。

遭此质疑风波之后,「木兰」的下载链接已经无法打开

「我们做了很多工作,只是扩大宣传而已」


对于木兰「套壳」事件,网络上已经闹得沸沸扬扬,纷纷丢出质疑证据。

知乎上一位开发者称「木兰就是 Python3.7.4 换了皮肤」

一个个的质疑实锤抛出来,「自主研发」的外衣披不住,当事人很快坐不住了。

1 月 18 日,项目负责人、刘雷及时发布了情况说明, 承认自己在接受记者的采访中有夸大的成分,并对本次事件「在网络上造成的不良影响」表示「郑重道歉」。

刘雷关于「木兰」编程语言的情况说明全文

接下来我们对这份「情况说明」进行一个简单解读。

【情况说明重点 1: 】
一、在语言规范上借鉴了 Lua 语言的特性并进行了扩展,增加数据表达方法等新的特性;
二、开发了支持少儿编程教育的可视化编程环境;
三、针对 8 位 AVR 单片机,实现了相应的编译器和运行时系统,开发了能模拟多任务执行的虚拟机。 以上产品已经在数百所中小学中,开展了 10 万人次的编程科普活动。

【解析】
只有第一条是在「木兰」的 exe 文件中体现出来,第二、三条都尚未发布。 注意第一条中的 「借鉴 Lua 语言」 ,知乎用户 @刘缙 对此发出质疑:

他「设计」的这个「新语言」能够在语法规则上一一对应到 Python AST 节点的唯一可能,就是这个语言从一开始就是在 Python 语法上小改的,语法结构都没动,只能改到关键字拼写,缩进改括号这个程度。 任何跨语句的语法改动都会造成无法简单映射到 Python AST。 但在刘雷的说明里,声称这个语言「借鉴了 Lua」,你「编译」到 Lua AST 试试?

情况说明重点 2:
针对 STM32 单片机,我们是 基于 Python 开源编译器进行的二次开发, 也就是先将木兰 语言的源程序转换为 Python 的中间表示(AST),再在 Python 虚拟机上运行。 这就是在开发和运行环境中会包含 Python 系统的原因。

【解析】
知乎用户 @刘缙 对此做了进一步分析,总结道:「木兰」的语法,本是上就是改了一下词法的 Python。

@刘缙 对此给出的通俗解释

他表示,一位开发者反编译了「木兰」语言的实现,从中 可以看到它的确自己写了一个 parser(解析器),但这个 parser 的每条规则都可以直接生成对应的 Python AST 节点。 注意,不是翻译,不是对 AST 作变换,而是「木兰」语言的语法规则直接对应到 Python AST 的节点。

如果你学过 parser,应该明白只有一种情况能这样做: 这个语言的语法本质上就是改了下词法的 Python。一个新设计的语法,不可能与另一个语法有如此简单的映射。然后它对整个 AST 的变换只有两个:给方法加上 implicit self。插入匿名函数。都是局部改动,AST 结构没变。比较搞笑的是第一项改动其实都不需要 parser,在 Python 里就能实现。

情况说明重点 3:
刘雷称他在 1 月 15 日接受媒体采访时,对木兰编程语言的介绍中,犯了以下错误:

1.  木兰编程语言主要是用于中小学教育,在介绍中将它 扩大 到智能物联领域。


2. 木兰语言在 8 位单片机上的编译器是本团队开发的,在 32 位单片机上的编译器是基于 Python 开源编译器进行的二次开发,但在接受采访中将木兰编程语言和编译器 夸大为完全自主开发。

对于此次在网络上造成的不良影响,本人郑重道歉,对给中科院、中科院计算所带来的不良后果表示诚挚的歉意。本人感谢大家的监督与批评,并深刻反省,保证不再出现类似问题。

【解析】
承认错误,道歉态度诚恳,但使用的字眼都是「扩大」、「夸大」,所以说, 没被发现就是「自主研发」,被发现了就是「夸张宣传」?

「木兰」背后:科研经费去哪儿了


除了用「换皮」冒充自主研发外,很多人也格外关注这个项目的科研经费问题。

知乎用户 @yang leonier 说, 它挂着中科院的名号,实际上却是一个中科院的二级三级企业控股 20% 的小公司做的,把自己吹成「下一代物联网编程语言」,发布出来的产品却是一个只能用于「少儿编程」而且还不够用的、runtime  直接用  Python3 的早期版本出来忽悠人。

这让人不禁联想到网络上流行的一个笑话,一个上千万元经费的项目,层层分拨下去后,竟然只有一个程序员拿着几千元的酬劳来完成。


对此,一些人也很淡定,表示「日常骗经费为正常操作」、「毕竟面向经费编程」……

看来科研圈的水还是蛮深的,但是,纸里终究包不住火,作假之前,也别低估了同行们的智商。

参考资料:
https://www.zhihu.com/question/366698484/answer/977940891
https://www.zhihu.com/people/yang-leonier/activities

重磅!CVer-学术交流群已成立


扫码可添加CVer助手,可申请加入CVer大群和细分方向群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索等群。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲长按加群


▲长按关注我们

麻烦给我一个在看!

登录查看更多
0

相关内容

《代码整洁之道》:5大基本要点
专知会员服务
49+阅读 · 2020年3月3日
【电子书】C++ Primer Plus 第6版,附PDF
专知会员服务
83+阅读 · 2019年11月25日
国家自然科学基金委发布2019年项目指南
专知
11+阅读 · 2018年12月30日
程序猿的终极噩梦,祖传代码,一动,修半年!
九章算法
4+阅读 · 2018年12月20日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
手把手教你安装深度学习软件环境(附代码)
数据派THU
4+阅读 · 2017年10月4日
从零开始:深度学习软件环境安装指南
机器之心
5+阅读 · 2017年10月2日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
Arxiv
99+阅读 · 2020年3月4日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
4+阅读 · 2018年11月6日
Arxiv
7+阅读 · 2018年3月17日
VIP会员
相关资讯
国家自然科学基金委发布2019年项目指南
专知
11+阅读 · 2018年12月30日
程序猿的终极噩梦,祖传代码,一动,修半年!
九章算法
4+阅读 · 2018年12月20日
10个深度学习软件的安装指南(附代码)
数据派THU
17+阅读 · 2017年11月18日
手把手教你安装深度学习软件环境(附代码)
数据派THU
4+阅读 · 2017年10月4日
从零开始:深度学习软件环境安装指南
机器之心
5+阅读 · 2017年10月2日
Python NLP 入门教程
开源中国
14+阅读 · 2017年10月1日
相关论文
Top
微信扫码咨询专知VIP会员