使用Scikit-Learn和Dask进行超参数搜索的工具
项目描述
使用Scikit-Learn和Dask进行超参数搜索的工具。
亮点
- Scikit-Learn的GridSearchCV和RandomizedSearchCV的即插即用替代品。 
- 可以使用线程、进程或跨集群分布来并行执行超参数优化。 
- 与Dask集合配合良好。Dask数组、dataframes和delayed可以传递给fit。 
- 具有相同参数和输入的候选估计器将只拟合一次。对于如Pipeline之类的复合估计器,这可以显著提高效率,因为它可以避免昂贵的重复计算。 
有关更多信息,请参阅文档。
安装
Dask-searchcv可通过conda或pip获得。
# Install with conda $ conda install dask-searchcv -c conda-forge # Install with pip $ pip install dask-searchcv
示例
from sklearn.datasets import load_digits
from sklearn.svm import SVC
import dask_searchcv as dcv
import numpy as np
digits = load_digits()
param_space = {'C': np.logspace(-4, 4, 9),
               'gamma': np.logspace(-4, 4, 9),
               'class_weight': [None, 'balanced']}
model = SVC(kernel='rbf')
search = dcv.GridSearchCV(model, param_space, cv=3)
search.fit(digits.data, digits.target)项目详情
下载文件
为您的平台下载文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分布
         dask-searchcv-0.2.0.tar.gz  (52.3 kB 查看哈希)
      
    构建分布
         dask_searchcv-0.2.0-py2.py3-none-any.whl  (40.0 kB 查看哈希)