【人工智能】AI公司的练级之道:如何更具扩展性?

2020 年 6 月 25 日 产业智能官
机器学习似乎已成为每个人都追求的一个宏大目标,超过80%的公司都正在研究至少一个AI项目。

图源:unsplash

在开始之前,最好先询问自己以下三个问题:

·        “此机器学习模型的准确性如何?”
·        “培训时间多长?”
·        “需要多少培训数据?”
 
用户通常想知道新模型的装载需要多长时间,以及它的性能或推广效果如何,他们想要一种根据性能衡量总体成本的方法。但遗憾的是,以上问题的答案并不能解决这个问题。
 
它们甚至具有误导性。
 
模型训练只是冰山一角。获取合适的数据集以及清理、存储、聚合、标记、建立可靠的数据流和基础架构管道需要巨大成本,但大多数用户和AI / ML公司都忽略了这一点。
 
根据最近的研究,公司在AI / ML项目中将80%以上的时间用于数据准备和工程业务。换句话说,如果将大部分精力放在构建和训练模型上,则总的工程工作量和成本可能是预计的五倍。
 
此外,机器学习模糊了用户和软件开发商之间的界线。
 
AIaaS或MLaaS已经开始出现。随着数据的增长,云端模型不断改进。也正因如此,MLaaS的业务比SaaS更具挑战性。

资料来源:黄Bastiane

机器模型从训练数据中学习,因此缺乏高质量的数据,模型将无法良好运行。在大多数情况下,用户并不了解生成或注释适当数据集的最佳做法。
 
当系统性能不佳时,用户往往会归咎于模型。因此,AI / ML公司通常花费大量时间和资源进行培训并与用户合作,以确保数据质量,这成为AI公司与其客户之间的共同责任。
 
图源:unsplash

例如,要训练生产线上的缺陷检查模型,计算机视觉公司需要与客户合作,以正确的角度和位置安装摄像头,检查分辨率和帧频,确保每个场景都有足够的正负面训练样本。
 
某些时候机器人或车辆需要人为操作,因此使用机器人技术或自动驾驶汽车应用程序进行数据收集更加耗时且成本更高。
 
即使进行了培训课程,且看完了所有用户手册和指南,你仍然不能完全控制用户生成的数据。一家机器视觉相机公司告诉我,他们的工程师会手动验证所有数据以确保其完整输入。
 
图源:unsplash

所有这些经常被忽视的额外培训、手动检查、数据清理和标记任务会给AI公司带来巨大的间接费用。这就是为什么要建立更具可扩展性的AI/ML项目的原因。那么该如何解决这个问题呢?
 
1、可扩展性是关键。

确定大量客户愿意购买的正确用例,并使用相同的模型体系结构解决。最后,你需要在没有标准产品的情况下为不同的公司构建和训练不同的模型。
 
2、尽量提供自助服务。

尽可能使培训和数据管道自动化,以提高运营效率并减少对体力劳动的依赖。相比较内部工具或自动化,公司更看重开放客户可见的功能,但是前者很快就会收到回报,你需要确保为内部流程自动化分配足够的资源。
 
3、最后,确定并跟踪成本,尤其是隐性成本。

工程师花费了多少时间清理、过滤或聚合数据?他们花费多少时间来确保第三方正确完成注释?他们需要多久帮助客户设置环境并正确收集数据?其中有多少可以自动化或外包?
 
图源:unsplash

练级之路可能艰难而漫长,但有些问题是迟早都需要面对的。


先进制造业+工业互联网




产业智能官  AI-CPS


加入知识星球“产业智能研究院”:先进制造业OT(自动化+机器人+工艺+精益)和工业互联网IT(云计算+大数据+物联网+区块链+人工智能)产业智能化技术深度融合,在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的产业智能化平台;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。


产业智能化平台作为第四次工业革命的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎; 重构设计、生产、物流、服务等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生 新技术、新产品、新产业、新业态和新模式; 引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。

产业智能化技术分支用来的今天,制造业者必须了解如何将“智能技术”全面渗入整个公司、产品、业务等商业场景中, 利用工业互联网形成数字化、网络化和智能化力量,实现行业的重新布局、企业的重新构建和焕然新生。

版权声明产业智能官(ID:AI-CPS推荐的文章,除非确实无法确认,我们都会注明作者和来源,涉权烦请联系协商解决,联系、投稿邮箱:erp_vip@hotmail.com。




登录查看更多
1

相关内容

【实用书】Python编程,140页pdf
专知会员服务
41+阅读 · 2020年8月20日
德勤:2020技术趋势报告,120页pdf
专知会员服务
187+阅读 · 2020年3月31日
专知会员服务
121+阅读 · 2020年3月26日
如何解决计算机视觉中的深度域适应问题?
AI前线
28+阅读 · 2019年7月24日
【干货】电商数据中台如何构建?
AliData
10+阅读 · 2019年4月4日
【工业智能】人工智能在智能制造中的应用
产业智能官
22+阅读 · 2019年1月11日
【人工智能】一文带你读懂特征工程!
产业智能官
6+阅读 · 2018年9月9日
手把手 | 关于商业部署机器学习,这有一篇详尽指南
软件工程师如何转型人工智能?
机器学习算法与Python学习
6+阅读 · 2018年4月26日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
10+阅读 · 2018年3月25日
手把手教你如何部署深度学习模型
全球人工智能
15+阅读 · 2018年2月5日
2018年4个需要关注的人工智能趋势
大数据技术
7+阅读 · 2018年1月30日
2018年的人工智能和深度学习将会如何发展? | 分析
网易智能菌
3+阅读 · 2017年12月30日
Arxiv
16+阅读 · 2020年5月20日
Advances and Open Problems in Federated Learning
Arxiv
18+阅读 · 2019年12月10日
Arxiv
6+阅读 · 2018年5月22日
Arxiv
3+阅读 · 2018年5月21日
Arxiv
11+阅读 · 2018年1月15日
VIP会员
相关资讯
如何解决计算机视觉中的深度域适应问题?
AI前线
28+阅读 · 2019年7月24日
【干货】电商数据中台如何构建?
AliData
10+阅读 · 2019年4月4日
【工业智能】人工智能在智能制造中的应用
产业智能官
22+阅读 · 2019年1月11日
【人工智能】一文带你读懂特征工程!
产业智能官
6+阅读 · 2018年9月9日
手把手 | 关于商业部署机器学习,这有一篇详尽指南
软件工程师如何转型人工智能?
机器学习算法与Python学习
6+阅读 · 2018年4月26日
人工智能与机器学习技术在医疗保健行业中的应用
深度学习与NLP
10+阅读 · 2018年3月25日
手把手教你如何部署深度学习模型
全球人工智能
15+阅读 · 2018年2月5日
2018年4个需要关注的人工智能趋势
大数据技术
7+阅读 · 2018年1月30日
2018年的人工智能和深度学习将会如何发展? | 分析
网易智能菌
3+阅读 · 2017年12月30日
Top
微信扫码咨询专知VIP会员