Github 项目推荐 | 用 Python 实现的大规模线性回归、分类和排名库 —— lightning

2018 年 5 月 16 日 AI研习社 AI研习君

Lightning 是大规模线性回归、分类、排名的 Python 库。

Highlights:

  • 遵循 scikit-learn API 约定(http://scikit-learn.org/)

  • 本地支持密集和稀疏数据表示

  • 在 Cython 中实现的计算要求较高的部分

Solvers supported:

  • 原始坐标下降

  • 双坐标下降 (SDCA,Prox-SDCA)

  • SGD,AdaGrad,SAG,SAGA,SVRG

  • FISTA

  示例

该示例展示了如何在 News20 数据集中学习具有组套索惩罚的多类分类器。

from sklearn.datasets import fetch_20newsgroups_vectorized
from lightning.classification import CDClassifier

# Load News20 dataset from scikit-learn.
bunch = fetch_20newsgroups_vectorized(subset="all")
X = bunch.data
y = bunch.target

# Set classifier options.
clf = CDClassifier(penalty="l1/l2",
                  loss="squared_hinge",
                  multiclass=True,
                  max_iter=20,
                  alpha=1e-4,
                  C=1.0 / X.shape[0],
                  tol=1e-3)

# Train the model.
clf.fit(X, y)

# Accuracy
print(clf.score(X, y))

# Percentage of selected features
print(clf.n_nonzero(percentage=True))

  依赖

  • Python >= 2.7

  • Numpy >= 1.3

  • SciPy >= 0.7

  • scikit-learn >= 0.15

  • 从源代码构建还需要 Cython 和一个可用的 C / C ++ 编译器

  • 要运行测试,nose >= 0.10

  安装

Lightning 稳定版本的预编译二进制文件在主要平台可用,需要用 pip 安装:

pip install sklearn-contrib-lightning

或者用 conda:

conda install -c conda-forge sklearn-contrib-lightning

开发版本的 Lightning 可以从 git 库上安装。在这种情况下,假设你拥有 git 版本控制系统,一个可用的 C ++ 编译器,Cython 和 numpy 开发库,然后输入:

git clone https://github.com/scikit-learn-contrib/lightning.git
cd lightning
python setup.py build
sudo python setup.py install

  文档

http://contrib.scikit-learn.org/lightning/

  Github

https://github.com/scikit-learn-contrib/lightning

从Python入门-如何成为AI工程师

BAT资深算法工程师独家研发课程

最贴近生活与工作的好玩实操项目

班级管理助学搭配专业的助教答疑

学以致用拿offer,学完即推荐就业


新人福利


关注 AI 研习社(okweiwu),回复  1  领取

【超过 1000G 神经网络 / AI / 大数据资料】


现在 tensorflow 和 mxnet 很火,是否还有必要学习 scikit-learn 等框架?

登录查看更多
0

相关内容

Scikit-learn项目最早由数据科学家David Cournapeau 在2007 年发起,需要NumPy和SciPy等其他包的支持,是Python语言中专门针对机器学习应用而发展起来的一款开源框架。
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
257+阅读 · 2020年6月10日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
《深度学习》圣经花书的数学推导、原理与Python代码实现
算法与数据结构Python,369页pdf
专知会员服务
160+阅读 · 2020年3月4日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
116+阅读 · 2019年12月31日
谷歌机器学习速成课程中文版pdf
专知会员服务
143+阅读 · 2019年12月4日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
Github 项目推荐 | 用 PyTorch 0.4 实现的 YoloV3
AI研习社
9+阅读 · 2018年8月11日
Github 推荐项目 | GloVe 的快速实现 —— Mittens
AI研习社
5+阅读 · 2018年7月21日
Github 项目推荐 | YOLOv3 的最小化 PyTorch 实现
AI研习社
25+阅读 · 2018年5月31日
Github 项目推荐 | 用 TensorFlow 实现的模型集合
AI研习社
5+阅读 · 2018年2月14日
推荐|TensorFlow/PyTorch/Sklearn实现的五十种机器学习模型
全球人工智能
24+阅读 · 2017年7月14日
Arxiv
35+阅读 · 2020年1月2日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
相关VIP内容
【实用书】Python机器学习Scikit-Learn应用指南,247页pdf
专知会员服务
257+阅读 · 2020年6月10日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
Sklearn 与 TensorFlow 机器学习实用指南,385页pdf
专知会员服务
126+阅读 · 2020年3月15日
《深度学习》圣经花书的数学推导、原理与Python代码实现
算法与数据结构Python,369页pdf
专知会员服务
160+阅读 · 2020年3月4日
《动手学深度学习》(Dive into Deep Learning)PyTorch实现
专知会员服务
116+阅读 · 2019年12月31日
谷歌机器学习速成课程中文版pdf
专知会员服务
143+阅读 · 2019年12月4日
【书籍】深度学习框架:PyTorch入门与实践(附代码)
专知会员服务
160+阅读 · 2019年10月28日
相关论文
Arxiv
35+阅读 · 2020年1月2日
Embedding Logical Queries on Knowledge Graphs
Arxiv
3+阅读 · 2019年2月19日
Arxiv
7+阅读 · 2018年3月22日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
11+阅读 · 2018年1月11日
Top
微信扫码咨询专知VIP会员