谷歌开源手势识别器，手机能用，运行流畅，还有现成的App，但是被我们玩坏了

会员服务 ·

谷歌开源手势识别器，手机能用，运行流畅，还有现成的App，但是被我们玩坏了

2019 年 8 月 23 日 CVer

点击上方“CVer”，选择加"星标"或“置顶”

重磅干货，第一时间送达

郭一璞发自凹非寺
本文转载自：量子位（QbitAI）

借助TensorFlow Lite和MediaPipe，谷歌刚刚开源了一款手势识别器，可以直接在手机上运行，实时跟踪，并且已经开源。

官方说，效果长这样：

有了这项应用，你可以开发手语识别、AR游戏，甚至用它来玩石头剪刀布。

有App可玩

谷歌已经把这款手势识别器做成了一款名为“Hand Tracking GPU”的App，在安卓端有对应的apk安装包，下载到手机上，安装成功后，无需联网就可以直接用了。

当然，iOS用户也可以安装，但是没有现成的安装包，可以下载源代码自行编译。

App默认调用前置摄像头，如果屏幕中出现的是你的脸，它是没有反应的。

伸手到屏幕前，就可以和官方演示的一样，识别出手部的各种姿势，123456789都可以识别：

或者比个“OK”：

点个赞：

反应还是非常敏锐的，效果不错。不过，不知是什么原因，有时候玩着玩着，屏幕也会突然“放空”，只能看到手，识别不出手势，这也被推特上的网友抓了包：

另外，这个App只支持一只手的手势识别，如果你把两只手都放到摄像头前，它只能识别一只：

说好的石头剪刀布呢？

当然，想想办法还是能让它识别两只手的，比如这样：

△ 它不知道我换了一只手

悄咪咪的，就把识别出的手势框图从一只手转移到了另一只手上。

△ 它也不知道我换回来了

当然，你也可以换回来，来去切换自如，仿佛背后的模型已经被忽悠瘸了。

三大模型

不过，被“忽悠瘸了”的锅，可不能让一个模型背，因为，这款应用的背后有3个模型。

BlazePalm

从整个图像中界定手部轮廓，找到手掌的位置，检测平均精度达到95.7%。

Hand Landmark

前一个模型找到手掌之后，这个模型负责定位关键点，它可以找到手掌上的21个关节坐标。

在训练过程中，研究人员们用到了将近30000张真实世界的标注过的手掌图片，来获取ground truth数据。

之后，用混合训练的方式训练模型。

Gesture Recognition

现在，手部关键点检测结果出来之后，需要判断比划出来的手势是什么意思，也就是识别出✌️是2，这里包含各种手势，除了123456789之外，还有yeah、ok等。

不过，遗憾的是似乎App里没有这个功能。

借助MediaPipe实现

最后的实现，借助了MediaPipe，这是一个构建机器学习pipeline的框架。用于手势识别的MediaPipe图长这样：

前面的各种模型，都融入到了这张整体的图里，可以看到从拍摄到出结果的全过程。

另外，借助MediaPipe，还可以做人脸检测：

头发分割：

物体检测：

具体内容，可以进入传送门体验：

传送门

MediaPipe
https://github.com/google/mediapipe

手部跟踪
https://github.com/google/mediapipe/blob/master/mediapipe/docs/hand_tracking_mobile_gpu.md

手势识别apk/源代码
https://drive.google.com/file/d/1uCjS0y0O0dTDItsMh8x2cf4-l3uHW1vE/view

重磅！CVer学术交流群成立啦

扫码添加CVer助手，可申请加入CVer-目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测和模型剪枝&压缩等群。一定要备注：研究方向+地点+学校/公司+昵称（如目标检测+上海+上交+卡卡）

▲长按加群

▲长按关注我们

麻烦给我一个在看！

登录查看更多

相关内容

谷歌

关注 13

谷歌公司（Google Inc.）成立于1998年9月4日，由拉里·佩奇和谢尔盖·布林共同创建，被公认为全球最大的搜索引擎。公司总部称为“Googleplex”，位于美国加州圣克拉拉县的芒廷维尤。业务包括互联网搜索、云计算、广告技术等，同时开发并提供大量基于互联网的产品与服务，其主要利润来自于AdWords等广告服务。

【WWW2020-微软】理解用户行为用于文档推荐

专知会员服务

36+阅读 · 2020年4月5日

【CVPR2020-牛津-谷歌】语音到动作:动作识别的跨模态监督，Cross-modal Supervision

专知会员服务

24+阅读 · 2020年3月31日

【干货书】流畅Python，766页pdf，中英文版

专知会员服务

226+阅读 · 2020年3月22日