项目名称: 垃圾邮件过滤的优化目标、建模及顺序回归研究

项目编号: No.60903083

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 金属学与金属工艺

项目作者: 孙广路

作者单位: 哈尔滨理工大学

项目金额: 18万元

中文摘要: 垃圾邮件过滤是网络信息处理中的重要问题,基于机器学习方法的垃圾邮件过滤技术是目前的研究热点。现有研究一般将过滤问题视为二值分类问题进行解决,存在着模型优化目标和性能评价指标不一致的问题,导致模型优化结果产生偏差,过滤性能受到很大影响。本课题拟通过直接优化评价指标来提升过滤器性能,将垃圾邮件过滤问题转化成排序问题进行建模,探索基于顺序回归学习的垃圾邮件过滤新模型;拟提出在线顺序逻辑回归学习算法,解决顺序回归学习中的邮件得分偏移问题;综合应用TONE算法和重采样技术,拟提出参数权重更新算法,解决顺序回归学习中在线调整模型参数时的处理速度问题,满足垃圾邮件实时过滤的要求;拟提出基于字节级n元文法的特征提取方法,解决垃圾邮件信息伪装和隐藏的问题。本课题力争在垃圾邮件过滤的理论和方法上有所创新和突破,旨在大幅提高垃圾邮件过滤的性能,推动信息过滤技术的发展。本课题的研究具有重要的学术意义和实践意义。

中文关键词: 垃圾邮件过滤;评价指标优化;排序模型;在线顺序回归学习;主动学习

英文摘要:

英文关键词: Spam Filterinig;Indicator Optimization;Ranking Model;OnlineOrdinal Regression Model;Active Learning

成为VIP会员查看完整内容
0

相关内容

【ICLR2022】序列生成的目标侧数据增强
专知会员服务
22+阅读 · 2022年2月14日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
21+阅读 · 2021年10月6日
专知会员服务
47+阅读 · 2021年8月4日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
【字节跳动-李航】一种按序列进行对话状态跟踪的方法
专知会员服务
28+阅读 · 2020年11月25日
【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测
专知会员服务
16+阅读 · 2020年8月16日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
去伪存真:因果约束下的图神经网络泛化
PaperWeekly
0+阅读 · 2022年2月10日
目标检测中边界框的回归策略
极市平台
17+阅读 · 2019年9月8日
博客 | 回归类算法最全综述及逻辑回归重点讲解
AI研习社
13+阅读 · 2018年11月29日
目标跟踪算法分类
算法与数据结构
20+阅读 · 2018年9月28日
已删除
将门创投
10+阅读 · 2018年5月2日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
17+阅读 · 2021年3月29日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
25+阅读 · 2017年12月6日
小贴士
相关VIP内容
【ICLR2022】序列生成的目标侧数据增强
专知会员服务
22+阅读 · 2022年2月14日
EMNLP 2021 | 学习改写非自回归机器翻译的翻译结果
专知会员服务
14+阅读 · 2021年12月25日
专知会员服务
21+阅读 · 2021年10月6日
专知会员服务
47+阅读 · 2021年8月4日
【经典书】机器学习统计学,476页pdf
专知会员服务
118+阅读 · 2021年7月19日
【字节跳动-李航】一种按序列进行对话状态跟踪的方法
专知会员服务
28+阅读 · 2020年11月25日
【KDD2020】基于纳什强化学习的鲁棒垃圾邮件发送者检测
专知会员服务
16+阅读 · 2020年8月16日
【推荐系统/计算广告/机器学习/CTR预估资料汇总】
专知会员服务
86+阅读 · 2019年10月21日
相关资讯
去伪存真:因果约束下的图神经网络泛化
PaperWeekly
0+阅读 · 2022年2月10日
目标检测中边界框的回归策略
极市平台
17+阅读 · 2019年9月8日
博客 | 回归类算法最全综述及逻辑回归重点讲解
AI研习社
13+阅读 · 2018年11月29日
目标跟踪算法分类
算法与数据结构
20+阅读 · 2018年9月28日
已删除
将门创投
10+阅读 · 2018年5月2日
相关基金
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
1+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
微信扫码咨询专知VIP会员