Lightning 是大规模线性回归、分类、排名的 Python 库。
Highlights:
遵循 scikit-learn API 约定(http://scikit-learn.org/)
本地支持密集和稀疏数据表示
在 Cython 中实现的计算要求较高的部分
Solvers supported:
原始坐标下降
双坐标下降 (SDCA,Prox-SDCA)
SGD,AdaGrad,SAG,SAGA,SVRG
FISTA
该示例展示了如何在 News20 数据集中学习具有组套索惩罚的多类分类器。
from sklearn.datasets import fetch_20newsgroups_vectorized
from lightning.classification import CDClassifier
# Load News20 dataset from scikit-learn.
bunch = fetch_20newsgroups_vectorized(subset="all")
X = bunch.data
y = bunch.target
# Set classifier options.
clf = CDClassifier(penalty="l1/l2",
loss="squared_hinge",
multiclass=True,
max_iter=20,
alpha=1e-4,
C=1.0 / X.shape[0],
tol=1e-3)
# Train the model.
clf.fit(X, y)
# Accuracy
print(clf.score(X, y))
# Percentage of selected features
print(clf.n_nonzero(percentage=True))
Python >= 2.7
Numpy >= 1.3
SciPy >= 0.7
scikit-learn >= 0.15
从源代码构建还需要 Cython 和一个可用的 C / C ++ 编译器
要运行测试,nose >= 0.10
Lightning 稳定版本的预编译二进制文件在主要平台可用,需要用 pip 安装:
pip install sklearn-contrib-lightning
或者用 conda:
conda install -c conda-forge sklearn-contrib-lightning
开发版本的 Lightning 可以从 git 库上安装。在这种情况下,假设你拥有 git 版本控制系统,一个可用的 C ++ 编译器,Cython 和 numpy 开发库,然后输入:
git clone https://github.com/scikit-learn-contrib/lightning.git
cd lightning
python setup.py build
sudo python setup.py install
http://contrib.scikit-learn.org/lightning/
https://github.com/scikit-learn-contrib/lightning
从Python入门-如何成为AI工程师
BAT资深算法工程师独家研发课程
最贴近生活与工作的好玩实操项目
班级管理助学搭配专业的助教答疑
学以致用拿offer,学完即推荐就业
新人福利
关注 AI 研习社(okweiwu),回复 1 领取
【超过 1000G 神经网络 / AI / 大数据资料】
现在 tensorflow 和 mxnet 很火,是否还有必要学习 scikit-learn 等框架?
▼▼▼