利用flask将机器学习模型嵌入到web系统中

2018 年 4 月 23 日 安全优佳 安小编
点击上方 “安全优佳” 可以订阅哦!

在这篇文章中,主要介绍如何将一个机器学习的模型嵌入到web系统中,这篇文章的主要内容包括:

1、利用flask构建一个简单的web

2、将机器学习模型嵌入到web系统中

3、根据用户的反馈来更新模型

主要包括三个页面,评论提交页面、分类结果页面、感谢页面。当用户提交评论后跳转到结果页面,后台根据已有的模型来预测用户评论是属于正面评论还是负面评论,返回属于哪一种评论并且返回属于该种类的概率为多少。提供两个用户反馈结果按钮,如果用户点击正确按钮,则说明预测正确,否则预测错误,并将结果保存到SQLlite数据库中,然后再跳转到感谢页面。

一、项目结构

db:目录中存放SQLite数据库文件。

pkl:存放模型文件,stopwords.pk为停用词文件,classifer.pkl为模型文件。

static:为静态文件目录,主要存放js和css文件。

templates:为模板文件目录,用来存放html文件。

app.py:主要文件,包含界面跳转和模型预测等功能。

updatePkl.py:为模型更新文件。

vectorizer.py:将评论转换成为特征向量便于预测。

二、界面说明

界面做的比较简单,没有过多的去调整的样式,主要是实现功能。

1、用户提交评论界面

用户在这个界面可以输入自己的评论,并提交。

2、分类结果页面

用户可以通过这个页面查看自己评论的分类结果,并可以进行相应的反馈。如果,用户没有确认是否正确,SQLite数据库中将不会保存这条评论所属的类别。

3、感谢页面

通过这个界面可以跳转到,提交评论界面。利用SQLiteStudio可以查看数据库保存评论

三、功能的实现

1、将评论转成特征向量

2、主要功能

3、模型更新

为什么要将更新模型用另一个文件运行,而不是在用户提交反馈之后就直接更新模型?

如果在同一时间评论的用户多的话,直接在用户提交反馈之后就更新模型,可能会造成在更新模型文件的时候会损坏模型文件。建议,在本地更新模型文件之后,再上传到服务器。

安全优佳

http://news.secwk.com

长按识别左侧二维码,关注我们

登录查看更多
4

相关内容

Flask is a microframework for Python based on Werkzeug, Jinja 2 and good intentions. And before you ask: It's BSD licensed! flask.pocoo.org/
【2020新书】实战R语言4,323页pdf
专知会员服务
98+阅读 · 2020年7月1日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
257+阅读 · 2020年6月10日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
115+阅读 · 2020年5月10日
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
34+阅读 · 2020年4月5日
Keras作者François Chollet推荐的开源图像搜索引擎项目Sis
专知会员服务
29+阅读 · 2019年10月17日
一文助你从零搭建自动交易系统,用Python玩转ML与量化
七月在线实验室
12+阅读 · 2019年9月10日
Python用于NLP :处理文本和PDF文件
Python程序员
4+阅读 · 2019年3月27日
基于Web页面验证码机制漏洞的检测
FreeBuf
7+阅读 · 2019年3月15日
34个最优秀好用的Python开源框架
专知
9+阅读 · 2019年3月1日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
如何用GitLab本地私有化部署代码库?
Python程序员
9+阅读 · 2018年12月29日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Arxiv
3+阅读 · 2018年3月2日
VIP会员
相关资讯
一文助你从零搭建自动交易系统,用Python玩转ML与量化
七月在线实验室
12+阅读 · 2019年9月10日
Python用于NLP :处理文本和PDF文件
Python程序员
4+阅读 · 2019年3月27日
基于Web页面验证码机制漏洞的检测
FreeBuf
7+阅读 · 2019年3月15日
34个最优秀好用的Python开源框架
专知
9+阅读 · 2019年3月1日
去哪儿网开源DNS管理系统OpenDnsdb
运维帮
21+阅读 · 2019年1月22日
如何用GitLab本地私有化部署代码库?
Python程序员
9+阅读 · 2018年12月29日
干货|用机器学习检测异常点击流
全球人工智能
6+阅读 · 2017年7月30日
Top
微信扫码咨询专知VIP会员