10月机器学习开源项目Top10

2018 年 10 月 30 日 机器学习算法与Python学习

作者 | Mybridge

译者 | 林春眄

整理 | Jane

出品 | AI科技大本营


过去一个月里,我们对近 250 个机器学习开源项目进行了排名,并挑选出热度前 10 的项目。这份清单的平均 github star 数量高达 1345,涵盖了包括深度学习, Tensorflow, 图像分割, 漫画着色, 强化学习,Unity 等主题,希望你能从中找到一个你所感兴趣的项目深入探究。


Top 1 :fastai


fastai 库由 fast.ai 研究团队贡献,使用当前最佳的实践研究简化了快速准确的神经网络训练。你可以在 fastai 官网找到并使用它。fastai 库是基于 fast.ai 团队进行的深度学习最佳实践研究,包括对视觉,文本,表格和协作(协同过滤)模型的支持,方便研究者直接使用。你可以在示例文件夹中找到有关示例,也可以参阅完整的文档以便了解更详细的使用说明。





Github 地址:

https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

官网:

https://docs.fast.ai/


Top 2:Deepvariant


Deepvariant 是由 Google 研究团队贡献的开源项目,通过运用深度神经网络来从下一代 DNA 序列数据中预测遗传变异。它是基于 Python/C++ 的程序,尚且只支持 Python 2.7,并能够在任何 unix 操作系统上运行。Deepvariant 具有高精度,强鲁棒性,快速高效,灵活性强,易于使用等优点。





Github 地址:

https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 3:Albumentations 


Albumentations 是一个快速的图像增强库,它易于使用并封装了其他一些图像处理库的功能。此外,它还具有如下特点:


  • 基于高度优化的 opencv 的快速扩充

  • 具有超级简单但功能强大的使用界面,并广泛适用于不用的任务,如分割,检测等

  • 易于定制

  • 易于添加其他的框架,兼容性好





Github 地址:

https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 4:MangaCraft


MangaCraft 是当前最佳的半自动化漫画着色项目。





Github 地址:

https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

参考视频:

https://www.bilibili.com/video/av32698923/


Top 5:Holodeck


Holodeck 是用于强化学习和机器人研究的模拟器,它具有高保真性。你可以访问该项目所提供的用户使用手册,以便更加详细的了解整个过程。





Github 地址:

https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more

使用手册

https://holodeck.readthedocs.io/en/latest/


Top 6:Petastorm


Petastorm 是 Uber ATG 研发的一个开源数据访问库。它可直接从 Apache Parquet格式的数据集中进行单机或分布式训练,以及深度学习模型的评估。此外,Petastorm 还支持当前流行的基于 Python 的机器学习(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通过纯 Python 代码来使用它。





Github 地址:

https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 7:Ngx


Ngx 是一个基于神经网络的视觉生成器和混合器,能够利用神经网络进行 VJing 过程。它将 pix2pix (使用 cGAN 的图像到图像转换)作为 ad-hoc 的下一帧预测模型,使用从视频剪辑中提取的成对连续帧数据进行反复地训练,以便模型能够生成无限持续时间的图像序列。此外,它还能够混合(交叉淡化) 两个 pix2pix 模型,这些模型会产生变化,并转换为生成的视频。





Gituhub 地址:

https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 8:AlphaAI


AlphaAI 是一个使用无监督和监督学习进行股票预测的开源项目,通过堆叠神经网络的实现来预测股票的盈利值。它包含多个训练组件,使用者可以通过调整替换各种组件组成以便模型获得最佳的预测结果。





Gituhub 地址:

https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 9:Blueoil


Blueoil 是一个将深度学习应用于小型设备的开源项目。它能够训练一个神经网络,并将训练好的模型转化为可执行的二进制库,以便通过 FPGA 进行加速。






Gituhub 地址:

https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more


Top 10:Tencent-ml-images


Tencent-ml-images 是包含当前最大的多标签图像数据库(ml-images) 的开源项目,共由 11166 个图像类别,17609752 张训练图像和 88739  哥验证数据的URL 地址组成。此外,通过迁移学习,将ml-images 上预训练好的ResNet-101 模型迁移到 ImageNet  数据库上,能够实现 80.73% 的 Top1 精度。





Gituhub 地址:

https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more



推荐阅读

互联网公司时尚穿搭指南

【资源】这本开放书籍帮你扫清通往ML的数学绊脚石

最强NLP预训练模型!谷歌BERT横扫11项NLP任务记录

朴素贝叶斯详解及中文舆情分析(附代码实践)

【代码集合】深度强化学习Pytorch实现集锦

pandas入门教程

【资源】机器学习算法工程师手册(PDF下载)

登录查看更多
3

相关内容

fast.ai网站提供了许多免费且高质量的AI教程。 官网地址:https://www.fast.ai/
AI创新者:破解项目绩效的密码
专知会员服务
32+阅读 · 2020年6月21日
【资源】100+本免费数据科学书
专知会员服务
105+阅读 · 2020年3月17日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
【机器学习课程】Google机器学习速成课程
专知会员服务
161+阅读 · 2019年12月2日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
3月份Github上最热门的数据科学和机器学习项目
大数据技术
7+阅读 · 2018年4月23日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
精选Top30!最实用的python开源项目都在这里
乌镇智库
4+阅读 · 2018年1月26日
Python 开源项目 Top30 | 值得收藏
人工智能头条
8+阅读 · 2018年1月19日
Arxiv
9+阅读 · 2019年4月19日
Arxiv
8+阅读 · 2019年3月28日
Scale-Aware Trident Networks for Object Detection
Arxiv
4+阅读 · 2019年1月7日
Arxiv
3+阅读 · 2018年5月28日
Arxiv
8+阅读 · 2018年5月21日
VIP会员
相关VIP内容
AI创新者:破解项目绩效的密码
专知会员服务
32+阅读 · 2020年6月21日
【资源】100+本免费数据科学书
专知会员服务
105+阅读 · 2020年3月17日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
2019->2020必看的十篇「深度学习领域综述」论文
专知会员服务
269+阅读 · 2020年1月1日
【机器学习课程】Google机器学习速成课程
专知会员服务
161+阅读 · 2019年12月2日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
相关资讯
2018-Github最热门机器学习开源项目Top10分享
深度学习与NLP
8+阅读 · 2019年1月22日
机器学习开源项目Top10
AI100
4+阅读 · 2019年1月20日
6月Python热文Top10,精选自1000篇文章
AI100
3+阅读 · 2018年6月15日
3月份Github上最热门的数据科学和机器学习项目
大数据技术
7+阅读 · 2018年4月23日
推荐 | 机器学习开源项目 Top 10
深度学习世界
4+阅读 · 2018年3月22日
精选Top30!最实用的python开源项目都在这里
乌镇智库
4+阅读 · 2018年1月26日
Python 开源项目 Top30 | 值得收藏
人工智能头条
8+阅读 · 2018年1月19日
相关论文
Arxiv
9+阅读 · 2019年4月19日
Arxiv
8+阅读 · 2019年3月28日
Scale-Aware Trident Networks for Object Detection
Arxiv
4+阅读 · 2019年1月7日
Arxiv
3+阅读 · 2018年5月28日
Arxiv
8+阅读 · 2018年5月21日
Top
微信扫码咨询专知VIP会员