“桃脸识别”什么鬼?肯尼亚的小哥利用深度学习做了一个智能分拣机

2017 年 10 月 2 日 机械鸡 百度AI


桃子的丰收季在7-9月,进入旺季之后,每天都有大批商贩到村里集中收桃,直接将桃卖给商贩,是绝大多数桃农的选择。桃商会根据桃子的大小、成色、品质等特征来分类收桃,收购价格也是有高有低。


为了实现桃子的优品优价,将桃子卖个好价钱,桃农们将大桃采摘下来之后要进行大量的分类工作。



因为想要等早上桃商来收桃时卖个好价钱,桃农刘师傅每天夜里两、三点就要起床下地干活,每年还需花费3万多元雇工人来帮忙摘桃和分桃。但毕竟工人流动性大,分拣水平也是参差不齐,费时费力不说,最终效果也很难保证。



但是今年,刘师傅一改往年的忙碌,桃子分拣工作有了得力助手。这位“员工”眼神好使、效率挺高、不知疲倦,而且还特别擅长自我学习,越挑越顺手、越捡越精准。


智能分拣,“桃脸”识别


这个“助手”,是北京工业大学的学生,借助百度深度学习开源平台PaddlePaddle 提供的模型算法制造出的智能分拣机。分拣机能在为每个大桃拍照之后,自动辨别大小、颜色、品相,实现机器自动分拣。



该机器,采用传送带工作方式,前端传送带负责将水果分列、调速,后端传送带加入图像采集计算和水果分级部分。通过百度AI算法完成水果分级判断,主控完成对机械结构的控制和调度,最终实现对水果的自动分列、判断、分装。


具体而言主要包含四个部分,传送带,推拉装置,控制电路和一个电脑主机。传送带上装有位置传感器,用于监控桃子在运动过程中几个关键时刻的位置。


推拉装置采用气动的方式,并利用电磁气动阀控制气源的通断。控制电路包含一个主控芯片和电磁阀的驱动电路。电脑主机用来运行PaddlePaddle的模型算法。


按照这个设计,将桃子倒入机器,利用机械原理将桃子排成一排,对每一个桃子进行拍照,照片快速经过自动档次分类,之后对应照片由助推器对桃子自动进行分类。



“桃脸”识别是怎么样炼成的 


周忠祥是北京工业大学自动化专业的学生,智能大桃分拣机就是他和其他3名同学制造的。有一次他们去平谷采摘,看到桃农手工分拣,感觉费时而且效率不高,就萌生了做一台机器的想法。



起初,学生们对制作机器信心满满,但如何判断大桃的品相成了问题。虽然擅长控制和电路,但“深度学习”对他们而言,都是初次接触。



一开始需要训练模型,学生买了不同颜色的海洋球进行分类,然后记录数据,进行训练。团队依据海洋球的颜色完成了四分类,机器准确率在90%以上。



虽然按照PaddlePaddle开源平台上的教程很快就学会了这些,但训练模型的准确率低,所以在Github提出了这个问题。并很快得到了PaddlePaddle社区值班人员的帮助,在技术人员的建议下,学生结合PaddlePaddle来源平台的教程,提高了准确率,得到了很好的效果。



为了让机器学会分桃,学生给机器“学习”了6400张大桃的照片,首先将桃子按分档建立图片数据集合,将图片数据集放入模型进行训练,模型会从各个分类的图片集合中,自动提取可以用于分级的特征并形成分类逻辑。



机器可以提取的要素比人工判别的依据要更为丰富、全面,所以依照PaddlePaddle最终提供的图片分类模型进行桃子训练,比人工分拣更为精确迅速。而且给机器的训练越多,积累的数据越多,机器还会自动学习升级,分级、分类的结果也会更加准确。


▲ 桃脸识别是怎样炼成的


PaddlePaddle 


PaddlePaddle,百度旗下深度学习开源平台。Paddle(Parallel Distributed Deep Learning,并行分布式深度学习)。目前PaddlePaddle 已在百度数十项主要产品和服务之中发挥着巨大作用。


百度paddlepaddle深度学习平台全套入门教程 ‖ 资源


2016年9月27日,百度宣布其全新的深度学习开源平台PaddlePaddle在开源社区Github及百度大脑平台开放,供广大开发者下载使用。百度是国内首个开源深度学习平台的科技公司。


▲ http://www.paddlepaddle.org


具体而言,智能分拣就是一个依托于PaddlePaddle完成的分类任务,在足够的计算资源和训练数据的情况下,CNN强大的特征提取能力使模型能够学习大量输入与输出之间的映射关系,同时保持很强的泛化能力,让机器做到像经验丰富的桃农一样,快速辨别桃子的品类和品质。


对于更复杂的任务,PaddlePaddle 模型仓库提供了大量已配置好的模型,并开放给整个开发者社区。从NLP任务到大规模的视觉分类任务,再到个性化推荐系统的模型,开发者可以根据不同需求选择模型,快速而便捷地完成所需。


另外值得一提的是,这次的学生团队还有肯尼亚的小伙伴,学习土木工程的西蒙(Simon),他对人工智能技术很感兴趣,也非常期待这次的研究成果能够在自己的家乡,以及非洲的其他国家得到应用,实现牛油果、芒果等更多品类果蔬的智能分拣。



近期,国务院出台了《新一代人工智能发展规划》指导意见,要将人工智能与各行业融合创新,在制造业、农业、物流、金融、商务、家居等各行业和领域实现规模化应用,全面提升产业发展智能化水平。这也正如百度CEO李彦宏所言,“任何一个产业,人工智能都可以在里面起到作用。” 


我们相信,未来,人工智能作为新一轮产业变革的核心驱动力,将会进一步释放历次科技革命和产业变革积蓄的巨大能量。


推荐阅读

专访深度学习之父Geoffrey Hinton

NIH发布全球最大胸部X光数据集

20年后的iphoneXXXX手机长这样

CMU用「PixelNN」完美还原马赛克照片(paper)

9行Python代码搭建神经网络(代码)

娃哈哈投资1000万美元在以色列建立AI研究中心

430家以色列人工智能初创公司图谱及十大特征 

25行Python代码实现人脸识别 || 教程

AI可以将UI设计图自动生成跨平台代码(paper)


长期招聘志愿者

加入「AI从业者社群」请备注个人信息

添加小鸡微信  liulailiuwang


登录查看更多
0

相关内容

PaddlePaddle(PArallel Distributed Deep LEarning)是由百度推出的一个易用、高效、灵活、可扩展的深度学习框架。 官方网站:https://www.paddlepaddle.org.cn
最新《多任务学习》综述,39页pdf
专知会员服务
260+阅读 · 2020年7月10日
【实用书】学习用Python编写代码进行数据分析,103页pdf
专知会员服务
190+阅读 · 2020年6月29日
少标签数据学习,54页ppt
专知会员服务
194+阅读 · 2020年5月22日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
一网打尽!100+深度学习模型TensorFlow与Pytorch代码实现集合
一只小白的学习自述:如何用OpenMV Cam 点亮机器人双眼。
如何利用深度学习识别千万张图片?
InfoQ
4+阅读 · 2017年12月30日
搜狗推出唇语识别技术 提升远场语音交互
智东西
3+阅读 · 2017年12月14日
深度学习CTPN+CRNN模型实现图片内文字的定位与识别(OCR)
北京思腾合力科技有限公司
35+阅读 · 2017年11月27日
【智能驾驶】史上最全自动驾驶系统解析
产业智能官
22+阅读 · 2017年8月21日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Attend More Times for Image Captioning
Arxiv
6+阅读 · 2018年12月8日
HAQ: Hardware-Aware Automated Quantization
Arxiv
6+阅读 · 2018年11月21日
Arxiv
7+阅读 · 2018年6月19日
Arxiv
4+阅读 · 2018年1月29日
Arxiv
8+阅读 · 2018年1月12日
VIP会员
Top
微信扫码咨询专知VIP会员