用了BERT就是香,AI评分还能给出评语,从此英文写作不再是噩梦!

2020 年 4 月 9 日 新智元













  新智元原创  

编辑:鹏飞,白峰,梦佳
【新智元导读】英语写作,是对英语水平最全面的考察,也是中国人学英语最大的痛点。网易有道词典新上线的AI作文批改正是看准了这一痛点,可以一键拍照手写识别,英语作文不再是噩梦。更重要的是:论文雅思考研四六级,打分评语纠错都可以,还免费!

同学们,还记得从小到大被各类英语考试支配的恐惧吗?

       


别跟我提语法!天哪,单单一个「时态」就足够令人崩溃:过去时、现在时、完成时、将来时、过去完成时、现在完成时、过去将来时、将来过去时……我选择当场去世时!更别提还有拼写、介词、单复数…


英语写作,是对英语水平最全面的考察,是词汇、语法、句法衔接,以及篇章结构组织的综合。中国学生在写英语作文时往往脑中先形成一个中文句子然后翻译成英文,导致这样写出来的句子牵强生硬缺乏英文美感。


在各类英语考试中,作文分数占比普遍很高。以雅思考试为例,多少烤鸭因为作文硬伤而屡次折戟。想要英语写作有质的飞跃,除了熟背某金牌英语培训机构出品的“开头结尾模版句”以外,还得有人不断地帮忙批改矫正。


网易有道词典新上线的AI作文批改正是看准了这一痛点。疫情期间,大家都改上网课了,有了AI作文批改,妈妈再也不用担心我写不好作文了。


网易有道词典,可能是中国人民最熟悉的在线词典了。


过去大多是查查单词,翻译翻译句子,现在竟然可以把作文连着一起批改了。


那还要啥自行车啊。


一键拍照,一秒自动智能批改,英语作文轻松搞定


打开有道词典,在导航栏里就能找到「作文批改」功能。

有道词典的AI作文批改功能,对不同的学段进行了有针对性的设置。从下图我们看到它从小学到四六级一直到雅思都有区分。

当然,这样区分不是为了让用户对号入座那么简单。它会从考试规定的词数、词汇丰富度、拼写、语法、句式,以及篇章的逻辑性、甚至主题相关性等多个维度进行打分。最终会给出总分,以及词汇、语法和结构等得分,并提供评语、词汇及范文推荐。


AI作文批改提供了两种方式输入内容,你可以把写在纸上的内容拍下来,或者直接从相册中选择拍好的照片,让系统去自动图片转文字;也可以直接手动输入,或者复制粘贴过来。


我们先来体验一键拍照。因为自己写的字太难看了,网上随便找了一个英文手写作文,这次我们将作文类型设置成「托福」。



使用网易有道词典拍照识别,速度快,识别正确率也高。这段内容比较简单字数也较少,因此分数不是很高,但是拼写和行文逻辑都比较好,因此最后给出了17分(满分30)。


接下来再试一下手动复制粘贴,作文类型设置成「考研」,文字从wiki上复制了一段有关赛博朋克的介绍。



对于考研作文来说,这段文字字数超了,其中还用到了一些高级词汇如sterling、drawn等,讲解的非常细致。


有道AI作文批改背后黑科技:预训练语言模型BERT闪亮登场


看了如此贴心的评价,是不是心动了,想好好写篇作文了?小助手不仅指出了错误,还给出了语法进阶指南,如果用了高级词汇还会对你大加赞扬!


看到这里,你可能会有疑问,有道的AI作文批改助手为什么跟现实中的老师一模一样?回想下学生时代的作文,我们最关注的是评分部分,其次是老师的评语,然后才是那一串的红圈圈,告诉你该怎么修改,有道词典的AI作文批改助手正是复现了这个流程。接下来我们就来看下有道是如何实现上述AI作文批改功能的。


首先是评分模型,采用了传统机器学习和深度学习相结合的方法,从词、句、篇章三个维度来给一篇作文打分,像词数、句子长度、区分是否为高级词汇等任务有道采用了传统的统计机器学习方法来做,而逻辑性、主题相关性等高层次特征则采用了深度学习来处理,我们知道深度学习在提取文本特征方面已经达到甚至超过了人的水平,虽然打分是个复杂的过程,但我们可以一步步拆解,就好比你要写文章,先要写个句子,要写句子先得积累很多词汇。


有道的评分网络我们耐心看就会发现并不复杂,评分网络采用了主流的LSTM+Attention模型,我们知道LSTM可以有效提取长短期的文本特征,而Attention可以捕捉到关键信息,之后我们就可以把评语生成当作序列生成的任务来解决了。

当我们刚上手一门外语的时候,最常遇到的就是语法错误和拼写错误,比如少写了一个字母,传统的拼写错误检查基于字典来做就可以,但是BERT的效果这么好,不用有点可惜了,这种纠错场景正是BERT这种预训练模型的用武之地,BERT可以很方便地完成命名实体识别、词性标注等任务,来辅助语法纠错。

想想你写作文的时候是否经常写错标点?标点作为句子分割的重要标志,其正确与否,直接关系到句子判断的准确率。所以AI作文批改,先要判断标点对错。有道AI作文批改助手将这一任务看作文本分类用BERT来完成,将各种标点看作不同的label,句子序列作为输入,在预训练模型的基础上微调就可实现标点纠错的功能。

没有对比就没有伤害,有道AI作文批改各项测试指标轻松胜出!


打分体系对比


有道AI作文批改会针对不同学段和不同类别的考试进行专业打分,生成报告,从词、句、篇章进行点评和推荐。语法纠正方面,给出了清晰的解析,甚至给出了提升的建议。



而在国外比较知名的Grammarly只进行简单的语法和单词拼写的纠错,无打分功能,无法判断学段和考试类型,没有专业点评报告。同时错误指正数较少,判断不全。



微软爱写作的打分系统不如有道AI作文批改这么细分,目测所有考试总分趋向雷同,可能未根据真实考试类型进行打分。




对比批改结果,总体看来,有道AI作文批改功能更有特色和优势。对字词句的解析更明确,而且针对不同考试更有针对性。


此外,微软爱写作和Grammarly均无拍照识别功能。


语法纠错对比


下面我们再选取三个病句,对比一下有道AI作文批改,Grammarly和批改网上的纠错效果(感谢iFanr制作下图表单)。



例句1:Like students sing English song.


可以看到在例句1中,三个网站都识别出了名词单复数错误,建议将〖song〗修正为【songs】,而只有有道识别出了疑似动词时态错误,建议将〖sing〗修正为【singing】


例句2:When the girl will leave, she fount an old begger in the tree and looked at angry and cold.


例句2中,有道指出疑似用词不当,建议将〖will leave〗修正为【left】;疑似动词时态错误,建议将〖fount〗修正为【found】;疑似名词误用,建议将〖begger〗修正为【beggar】;at删除


Grammarly免费版建议将“begger”更改为“beggar”


批改网也识别出了fount和begger的错误,但是针对介词误用,上下文判断不如有道精准。


例句3:But this stress didn't stop me from thinking to attend the biggist activity in our school.


例句3中,有道指出疑似拼写错误,建议将〖biggist〗修正为【biggest】;疑似介词错误,建议将〖to〗修正为【about】; 疑似动词时态错误,建议将〖attend〗修正为【attending】


Grammarly免费版建议将“Biggist”更改为“biggest”。这一句批改网和有道修正效果相同。


整体来讲,有道AI作文批改能识别出较复杂的语法错误,如时态错误(过去式居多),动词原形与动名词误用,并能根据上下文查找到代词的误用。相比之下,Grammarly偏向简单的语法修改,如介词误用,名词单复数错误和单词拼写。批改网识别出了语法错误,但是判断不如有道准确。


更详细对比参照下图(感谢iFanr提供下图表单)。


随身带个AI老师,让你爱上英文写作!


任何技术的大规模利用都需要一段时间的适应。AI+教育是未来的必然趋势。有了海量数据和算法的加持,教育效率将大幅度提升,AI批改的优势将越来越明显。


随着图像识别、自然语言处理、语义理解、深度学习等AI底层技术的进步,未来AI作业批改的功力也将进一步完善,图像语音识别等多媒体协助教学都不再是梦想。


活到老学到老。我们身处在一个瞬息万变的时代,「学习」开始变得前所未有的重要,不再是仅仅为了拿个文凭得个学历,而是真正成为提升自我、不断前进的动力。


在全球化的浪潮之下,学习一门外语更不仅仅是为了考试需要,更是一个和不同文化交流的重要手段。


在「终身学习」的前提下,自学占据了我们人生中的绝大部分时间。有了有道AI作文批改,可以高效地指出英语作文中,词汇语法时态句式连接等语言基础方面的问题,我们可以随时随地的练习英文写作,即时了解写作水平,并获得针对性修改建议。如同请了一个永远不会嫌烦、不冲我们发脾气的私人家教。


最重要的是,有道AI作文批改不仅免费,而且雅思考研四六级全覆盖,打分评语纠错一个不少,堪比真人作文老师


是时候体验一下有道词典用AI征服英语的感受了。


登录查看更多
1

相关内容

【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
【2020新书】简明机器学习导论,电子书与500页PPT
专知会员服务
199+阅读 · 2020年2月7日
【课程推荐】普林斯顿陈丹琦COS 484: 自然语言处理课程
专知会员服务
82+阅读 · 2019年12月11日
【机器学习课程】Google机器学习速成课程
专知会员服务
162+阅读 · 2019年12月2日
这么多年,终于知道为啥右指针不能往回走了
九章算法
5+阅读 · 2019年4月15日
7 个从来没推荐过的App,用了让你变得更厉害
高效率工具搜罗
9+阅读 · 2019年2月18日
AI产品经理:对话型机器人话术设计思路
NPDP产品经理资讯
5+阅读 · 2018年7月4日
如何完成一篇有效的英文写作
中科院物理所
6+阅读 · 2018年4月13日
论机器翻译之浅薄
AI100
3+阅读 · 2018年4月7日
人工智能为什么看起来像人工智障?
大数据技术
6+阅读 · 2017年9月15日
中文NLP难于英文?从语言学角度看中文NLP、NLU难在哪里
炼数成金订阅号
3+阅读 · 2017年7月3日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Arxiv
3+阅读 · 2019年9月5日
How to Fine-Tune BERT for Text Classification?
Arxiv
13+阅读 · 2019年5月14日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Arxiv
13+阅读 · 2018年4月6日
VIP会员
相关资讯
这么多年,终于知道为啥右指针不能往回走了
九章算法
5+阅读 · 2019年4月15日
7 个从来没推荐过的App,用了让你变得更厉害
高效率工具搜罗
9+阅读 · 2019年2月18日
AI产品经理:对话型机器人话术设计思路
NPDP产品经理资讯
5+阅读 · 2018年7月4日
如何完成一篇有效的英文写作
中科院物理所
6+阅读 · 2018年4月13日
论机器翻译之浅薄
AI100
3+阅读 · 2018年4月7日
人工智能为什么看起来像人工智障?
大数据技术
6+阅读 · 2017年9月15日
中文NLP难于英文?从语言学角度看中文NLP、NLU难在哪里
炼数成金订阅号
3+阅读 · 2017年7月3日
Top
微信扫码咨询专知VIP会员