基于深度神经网络的自动作文评分算法研究 - 专知基金

会员服务 ·

0

自然语言处理 · 深度学习 · 自动作文评分 ·

2014 年 12 月 31 日

基于深度神经网络的自动作文评分算法研究

国家自然科学基金

国家自然科学基金委员会

项目名称： 基于深度神经网络的自动作文评分算法研究

项目编号： No.61472391

项目类型： 面上项目

立项/批准年度： 2015

项目学科： 计算机科学学科

项目作者： 何苯

作者单位： 中国科学院大学

项目金额： 80万元

中文摘要： 在自动作文评分系统中, 对能够衡量作文水平与质量的特征的提取是保证评分准确性的关键技术手段。当前的自动作文评分算法普遍采用文章长度、语法错误等浅层特征，然而受限于目前自然语言处理技术水平，这些特征仅能在词法句法层面有效反应作文写作质量，而对于语义内容层面则仅能定制出较为浅层的特征，无法正确表示作文的上下文语义内容。申请人在前期工作探索了多种自动作文评分方法和评分模型常用特征与写作质量的相关性和泛化能力，归纳出当前自动作文评分技术因受限于所用特征的浅层性问题，导致该技术的鲁棒性和有效性受到严重制约。在此基础上，本研究拟基于深度学习技术构建新的自动作文评分算法，通过挖掘深层次的、能够有效反应文章写作质量的语义特征, 进而训练基于深度神经网络的自动作文评分模型，并在ASAP与HSK等公开中英文作文数据集上通过多重交叉检验进行性能验证评价，以期能显著提升现有评分系统的人机一致率和鲁棒性。

中文关键词： 自然语言处理；深度学习；自动作文评分

英文摘要： Automated essay scoring (AES) utilizes pre-defined features to measure the writing quality of essays. However, due to the limits of the existing natural language processing techniques, current AES systems are only capable of making use of shallow text features such as the essay length and the number of grammar errors. As a consequence, current AES systems are not able to represent the exact semantic content of essays, resulting in limited robustness and effectiveness. To this end, we have investigated the relationship between various pre-defined features and the writing quality. Based on our prior studies, this project aims to develop a novel AES algorithm based on deep neural networks (DNN) by mining deep semantic features which can effectively reflect essay writing quality. The evaluation of the essay rating model trained by the new algorithm is planned to be done by cross-validation on the ASAP and HSK public datasets, which are in English and Chinese, respectively. Our proposed approach is expected to show significantly improved effectiveness in terms of human-machine agreement and robustness in the experiments.

英文关键词： Natural language processing;Deep learning;Automated essay scoring

成为VIP会员查看完整内容

1

相关内容

自然语言处理

自然语言处理

自然语言处理（NLP）是语言学，计算机科学，信息工程和人工智能的一个子领域，与计算机和人类（自然）语言之间的相互作用有关，尤其是如何对计算机进行编程以处理和分析大量自然语言数据。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

专知会员服务

24+阅读 · 2022年1月20日

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

【KDD2021】基于深度序列嵌入的分类模型的个性化文本生成攻击

专知会员服务

19+阅读 · 2021年7月11日

模糊失真图像无参考质量评价综述

专知会员服务

18+阅读 · 2021年7月3日

针对深度学习模型的对抗性攻击与防御

专知会员服务

48+阅读 · 2021年5月17日

面向自然语言处理的深度学习对抗样本综述

专知会员服务

45+阅读 · 2021年1月18日

深度学习下的医学影像分割算法综述

专知会员服务

116+阅读 · 2021年1月11日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

【微软】利用知识图谱提高抽象摘要的事实正确性，Boosting Factual Correctness

专知会员服务

18+阅读 · 2020年3月23日

【哈工大】基于抽取的高考作文生成

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日

如何提取关键词？ECIR2022最新《关键词提取》教程，

如何提取关键词？ECIR2022最新《关键词提取》教程，

专知

0+阅读 · 2022年4月12日

你会信任哪些平台的评分评价？

你会信任哪些平台的评分评价？

ZEALER订阅号

0+阅读 · 2022年3月20日

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

专知

0+阅读 · 2021年12月5日

基于Pytorch的开源推荐算法库

基于Pytorch的开源推荐算法库

机器学习与推荐算法

1+阅读 · 2021年10月12日

【WWW2021】神经公平协同过滤的去偏见职业推荐

【WWW2021】神经公平协同过滤的去偏见职业推荐

专知

1+阅读 · 2021年4月7日

神经机器阅读理解最新综述：方法和趋势

神经机器阅读理解最新综述：方法和趋势

PaperWeekly

15+阅读 · 2019年7月25日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

已删除

将门创投

13+阅读 · 2019年4月17日

LibRec 每周算法：LDA主题模型

LibRec 每周算法：LDA主题模型

LibRec智能推荐

29+阅读 · 2017年12月4日

LibRec 每周算法：DeepFM

LibRec 每周算法：DeepFM

LibRec智能推荐

14+阅读 · 2017年11月6日

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于迁移学习的脑机接口特征提取和预测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的隐写分析新方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

可比语料库质量量化与提升方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉语句法分析中的自动歧义识别和分类问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于弱线性回归树在线学习的自适应视频目标检测算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于正则化子空间学习的图像特征提取方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于压缩域听觉谱的音频分类与检索算法研究

国家自然科学基金

0+阅读 · 2008年12月31日

Two continuous (4, 5) pairs of explicit 9-stage Runge-Kutta methods

Arxiv

0+阅读 · 2022年4月19日

System Analysis for Responsible Design of Modern AI/ML Systems

Arxiv

0+阅读 · 2022年4月19日

Using deep learning to detect patients at risk for prostate cancer despite benign biopsies

Arxiv

0+阅读 · 2022年4月19日

A Comprehensive Survey on Trustworthy Graph Neural Networks: Privacy, Robustness, Fairness, and Explainability

Arxiv

0+阅读 · 2022年4月18日

AB/BA analysis: A framework for estimating keyword spotting recall improvement while maintaining audio privacy

Arxiv

0+阅读 · 2022年4月18日

Data-Centric Distrust Quantification for Responsible AI: When Data-driven Outcomes Are Not Reliable

Arxiv

0+阅读 · 2022年4月16日

A Reinforcement Learning Approach to Parameter Selection for Distributed Optimal Power Flow

Arxiv

0+阅读 · 2022年4月15日

Do Feature Attribution Methods Correctly Attribute Features?

Arxiv

15+阅读 · 2021年12月15日

Trustworthy AI: From Principles to Practices

Arxiv

46+阅读 · 2021年10月4日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

18+阅读 · 2019年10月30日

阅读: 0 点赞: 0

小贴士

登录享主题订阅及个性化推荐

相关主题

自然语言处理

自动作文评分

热门VIP内容

开通专知VIP会员享更多权益服务

【MIT博士论文】弱监督学习：理论、方法与应用

Andrej Karpathy：2025 年 LLM 年度回顾（2025 LLM Year in Review）

锚定情报：合成欺骗时代的地面真相

NeurIPS 2025 | NMKE：基于神经元归因与动态稀疏掩码的终身知识编辑

相关VIP内容

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

【TheWebConf 2022】基于图神经网络的细粒度语义挖掘方法研究

专知会员服务

24+阅读 · 2022年1月20日

【IJCAI2021】BESA: 基于BERT模拟退火算法的对抗性文本攻击

专知会员服务

14+阅读 · 2021年8月28日

【KDD2021】基于深度序列嵌入的分类模型的个性化文本生成攻击

专知会员服务

19+阅读 · 2021年7月11日

模糊失真图像无参考质量评价综述

专知会员服务

18+阅读 · 2021年7月3日

针对深度学习模型的对抗性攻击与防御

专知会员服务

48+阅读 · 2021年5月17日

面向自然语言处理的深度学习对抗样本综述

专知会员服务

45+阅读 · 2021年1月18日

深度学习下的医学影像分割算法综述

专知会员服务

116+阅读 · 2021年1月11日

深度学习的对抗攻击与防御方法综述

专知会员服务

99+阅读 · 2020年12月8日

【微软】利用知识图谱提高抽象摘要的事实正确性，Boosting Factual Correctness

专知会员服务

18+阅读 · 2020年3月23日

【哈工大】基于抽取的高考作文生成

【哈工大】基于抽取的高考作文生成

专知会员服务

37+阅读 · 2020年3月10日

相关资讯

如何提取关键词？ECIR2022最新《关键词提取》教程，

如何提取关键词？ECIR2022最新《关键词提取》教程，

专知

0+阅读 · 2022年4月12日

你会信任哪些平台的评分评价？

你会信任哪些平台的评分评价？

ZEALER订阅号

0+阅读 · 2022年3月20日

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

【博士论文】具有文学表现力的中文古典诗歌自动写作方法研究

专知

0+阅读 · 2021年12月5日

基于Pytorch的开源推荐算法库

基于Pytorch的开源推荐算法库

机器学习与推荐算法

1+阅读 · 2021年10月12日

【WWW2021】神经公平协同过滤的去偏见职业推荐

【WWW2021】神经公平协同过滤的去偏见职业推荐

专知

1+阅读 · 2021年4月7日

神经机器阅读理解最新综述：方法和趋势

神经机器阅读理解最新综述：方法和趋势

PaperWeekly

15+阅读 · 2019年7月25日

深度学习与医学图像分析

深度学习与医学图像分析

人工智能前沿讲习班

40+阅读 · 2019年6月8日

已删除

将门创投

13+阅读 · 2019年4月17日

LibRec 每周算法：LDA主题模型

LibRec 每周算法：LDA主题模型

LibRec智能推荐

29+阅读 · 2017年12月4日

LibRec 每周算法：DeepFM

LibRec 每周算法：DeepFM

LibRec智能推荐

14+阅读 · 2017年11月6日

相关基金

基于海量软件片段比对的恶意代码检测方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于深度神经网络的雷达目标高分辨距离像稳健识别方法

国家自然科学基金

6+阅读 · 2015年12月31日

无监督分词及词性归纳联合方法研究

国家自然科学基金

1+阅读 · 2013年12月31日

基于迁移学习的脑机接口特征提取和预测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

基于深度学习的隐写分析新方法研究

国家自然科学基金

4+阅读 · 2013年12月31日

可比语料库质量量化与提升方法研究

国家自然科学基金

0+阅读 · 2013年12月31日

汉语句法分析中的自动歧义识别和分类问题研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于弱线性回归树在线学习的自适应视频目标检测算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于正则化子空间学习的图像特征提取方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于压缩域听觉谱的音频分类与检索算法研究

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Two continuous (4, 5) pairs of explicit 9-stage Runge-Kutta methods

Arxiv

0+阅读 · 2022年4月19日

System Analysis for Responsible Design of Modern AI/ML Systems

Arxiv

0+阅读 · 2022年4月19日

Using deep learning to detect patients at risk for prostate cancer despite benign biopsies

Arxiv

0+阅读 · 2022年4月19日

A Comprehensive Survey on Trustworthy Graph Neural Networks: Privacy, Robustness, Fairness, and Explainability

Arxiv

0+阅读 · 2022年4月18日

AB/BA analysis: A framework for estimating keyword spotting recall improvement while maintaining audio privacy

Arxiv

0+阅读 · 2022年4月18日

Data-Centric Distrust Quantification for Responsible AI: When Data-driven Outcomes Are Not Reliable

Arxiv

0+阅读 · 2022年4月16日

A Reinforcement Learning Approach to Parameter Selection for Distributed Optimal Power Flow

Arxiv

0+阅读 · 2022年4月15日

Do Feature Attribution Methods Correctly Attribute Features?

Arxiv

15+阅读 · 2021年12月15日

Trustworthy AI: From Principles to Practices

Arxiv

46+阅读 · 2021年10月4日

Meta-Learning to Cluster

Meta-Learning to Cluster

Arxiv

18+阅读 · 2019年10月30日

微信扫码咨询专知VIP会员