项目名称: 面向大规模数据挖掘的隐私保护支持向量机增量与并行学习算法研究

项目编号: No.61202152

项目类型: 青年科学基金项目

立项/批准年度: 2013

项目学科: 计算机科学学科

项目作者: 段华

作者单位: 山东科技大学

项目金额: 24万元

中文摘要: 隐私保护是当前数据挖掘领域中一个重要的研究课题,其中隐私保护支持向量机(PPSVM)日益受到关注。由于PPSVM所处理的数据集既要保密又要反映真实情况,对PPSVM的算法研究与一般SVM不尽相同。为提高大规模数据集的学习效率,本项目针对PPSVM的增量学习算法以及学习算法的并行化问题进行研究。首先研究大规模数据集有效加密措施,形成一个局部独立、整体协作的数据集。其次,构造PPSVM可行的求解算法,尤其是针对大规模的数据集探讨SOR方法在PPSVM求解中的应用。再次,引入PPSVM增量学习技术,减少存储空间,提高训练速度;最后,研究PPSVM的并行算法,使之能快速地求解超大规模的分类问题。本项目将建立上述问题的理论基础,研究模型解的等价性、各算法的收敛性。研究PPSVM算法的参数优化选取,使PPSVM算法的性能达到最优。项目研究结果将在银行、保险等行业中的予以应用验证。

中文关键词: 支持向量机;隐私保护;大规模数据挖掘;增量学习;流程挖掘

英文摘要: Privacy protection is an important research topic in the field of data mining, and the Privacy Preserving Support Vector Machine (PPSVM) obtains more and more attention. The data set processing by PPSVM is necessary to keep confidential but also to reflect the true situation, so the algorithm research of PPSVM is different to that of the general SVM. To improve the learning efficiency of large-scale data sets, the project mainly focuses on the incremental and parallel learning algorithms for PPSVM towards privacy protection. The first problem is to address the effective encryption of large data sets, so as to obtain an independent locally data set with an overall coordination. Secondly, the feasible solution algorithms are constructed for PPSVM. Especially for large-scale data set, the SOR method is introducted for solving the model of PPSVM. The third problem focuses on the incremental learning algorithms for PPSVM so as to improve the training speed and reduce storage space. Finally, the parallel learning algorithms are constructed for PPSVM so that it can quickly solve large-scale classification problems. The goal of the project is to establish the theoretical basis of the above problems and to prove the equivalence of solutions of the model and the convergence of the algorithm. Another goal is to to discuss

英文关键词: Support Vector Machine;Privacy Protection;Large-scale Data Mining;Incremental Learning;Process Mining

成为VIP会员查看完整内容
0

相关内容

在机器学习中,支持向量机(SVM,也称为支持向量网络)是带有相关学习算法的监督学习模型,该算法分析用于分类和回归分析的数据。支持向量机(SVM)算法是一种流行的机器学习工具,可为分类和回归问题提供解决方案。给定一组训练示例,每个训练示例都标记为属于两个类别中的一个或另一个,则SVM训练算法会构建一个模型,该模型将新示例分配给一个类别或另一个类别,使其成为非概率二进制线性分类器(尽管方法存在诸如Platt缩放的问题,以便在概率分类设置中使用SVM)。SVM模型是将示例表示为空间中的点,并进行了映射,以使各个类别的示例被尽可能宽的明显间隙分开。然后,将新示例映射到相同的空间,并根据它们落入的间隙的侧面来预测属于一个类别。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
视频隐私保护技术综述
专知会员服务
33+阅读 · 2022年1月19日
专知会员服务
33+阅读 · 2021年10月17日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
39+阅读 · 2021年3月8日
专知会员服务
38+阅读 · 2020年12月20日
机器学习模型安全与隐私研究综述
专知会员服务
108+阅读 · 2020年11月12日
专知会员服务
123+阅读 · 2020年8月7日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
130+阅读 · 2020年3月25日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
《鲁棒和隐私保护的协同学习》综述论文
专知
4+阅读 · 2021年12月22日
区块链数据安全服务综述
专知
2+阅读 · 2021年11月10日
【WWW2021】 大规模组合K推荐
专知
0+阅读 · 2021年5月3日
长文本表示学习概述
云栖社区
15+阅读 · 2019年5月9日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
26+阅读 · 2018年12月13日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
Chinese Idiom Paraphrasing
Arxiv
0+阅读 · 2022年4月15日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
17+阅读 · 2022年1月11日
Arxiv
28+阅读 · 2021年9月26日
小贴士
相关VIP内容
视频隐私保护技术综述
专知会员服务
33+阅读 · 2022年1月19日
专知会员服务
33+阅读 · 2021年10月17日
【WWW2021】大规模智能手机数据的异质联邦学习
专知会员服务
39+阅读 · 2021年3月8日
专知会员服务
38+阅读 · 2020年12月20日
机器学习模型安全与隐私研究综述
专知会员服务
108+阅读 · 2020年11月12日
专知会员服务
123+阅读 · 2020年8月7日
【中国人民大学】机器学习的隐私保护研究综述
专知会员服务
130+阅读 · 2020年3月25日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
《鲁棒和隐私保护的协同学习》综述论文
专知
4+阅读 · 2021年12月22日
区块链数据安全服务综述
专知
2+阅读 · 2021年11月10日
【WWW2021】 大规模组合K推荐
专知
0+阅读 · 2021年5月3日
长文本表示学习概述
云栖社区
15+阅读 · 2019年5月9日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
26+阅读 · 2018年12月13日
机器学习(17)之集成学习原理总结
机器学习算法与Python学习
19+阅读 · 2017年9月16日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2010年12月31日
微信扫码咨询专知VIP会员