如今,大多数数据科学家和工程师都依赖有质量标记的数据来训练机器学习模型。但是,手工构建训练集既耗时又昂贵,导致许多公司的ML项目尚未完成。还有一个更实际的方法。在这本书中,Wee Hyong Tok, Amit Bahree和Senja Filipi向您展示了如何使用弱监督学习模型创建产品。

您将学习如何使用来自Snorkel的弱标记数据集构建自然语言处理和计算机视觉项目,Snorkel是斯坦福人工智能实验室的一个副产品。因为许多公司一直在进行ML项目,但从来没有超越他们的实验室,所以这本书还提供了如何交付您所构建的深度学习模型的指南。

https://www.oreilly.com/library/view/practical-weak-supervision/9781492077053/

了解监督缺乏的领域,包括如何将其作为数据科学过程的一部分 使用Snorkel AI进行弱监督和数据编程 获取使用Snorkel标记文本和图像数据集的代码示例 使用弱标记数据集对文本和图像进行分类 学习将Snorkel与大数据集一起使用以及使用Spark集群来扩展标签的实际注意事项

  • 第1章提供了弱监督领域的基本介绍,以及数据科学家和机器学习工程师如何将其用作数据科学过程的一部分。
  • 第2章讨论了如何开始使用Snorkel进行弱监督,并介绍了使用Snorkel进行数据编程的概念。
  • 第3章描述了如何使用Snorkel进行标签,并提供了如何使用Snorkel对文本和图像数据集进行标签的代码示例。
  • 第4章和第5章作为本书的一部分,使实践者对如何使用弱标记数据集进行文本和图像分类有一个端到端的理解。
  • 第6章讨论了在使用Snorkel和大数据集时的实际考虑,以及如何使用Spark集群来扩展标记。

成为VIP会员查看完整内容
69

相关内容

弱监督学习:监督学习的一种。大致分3类,第一类是不完全监督(incomplete supervision),即,只有训练集的一个(通常很小的)子集是有标签的,其他数据则没有标签。这种情况发生在各类任务中。例如,在图像分类任务中,真值标签由人类标注者给出的。从互联网上获取巨量图片很容易,然而考虑到标记的人工成本,只有一个小子集的图像能够被标注。第二类是不确切监督(inexact supervision),即,图像只有粗粒度的标签。第三种是不准确的监督(inaccurate supervision),模型给出的标签不总是真值。出现这种情况的常见原因有,图片标注者不小心或比较疲倦,或者某些图片就是难以分类。
【2020新书】Python专业实践,250页pdf,Practices of the Python Pro
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
255+阅读 · 2020年6月10日
【Manning2020新书】Elm 实战,344页pdf,Elm in Action
专知会员服务
49+阅读 · 2020年4月14日
【2020新书】Kafka实战:Kafka in Action,209页pdf
专知会员服务
65+阅读 · 2020年3月9日
浅谈主动学习(Active Learning)
凡人机器学习
30+阅读 · 2020年6月18日
TensorFlow图像分类教程
机器学习研究会
33+阅读 · 2017年12月29日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年6月3日
Arxiv
21+阅读 · 2021年12月31日
Arxiv
16+阅读 · 2021年7月18日
SlowFast Networks for Video Recognition
Arxiv
19+阅读 · 2018年12月10日
Arxiv
21+阅读 · 2018年8月30日
Arxiv
15+阅读 · 2018年2月4日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
4+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员