跳转到主要内容

Jubatus工具包

项目描述

Travis Coveralls PyPi

jubakit: Jubatus 工具包

jubakit 是一个用于轻松访问 Jubatus 特性的 Python 模块。jubakit 可以与 scikit-learn 结合使用,以便您可以使用交叉验证和模型评估等强大功能。请参阅Jubakit 文档以获取详细描述。

目前 jubakit 支持 分类器回归异常推荐最近邻聚类突发多臂老虎机权重引擎。

安装

pip install jubakit

要求

  • Python 2.7、3.3、3.4 或 3.5。

  • Jubatus 需要安装。

  • 尽管不是必需的,但为了使用诸如 K 折交叉验证等一些功能,需要安装scikit-learn

快速入门

以下示例展示了如何使用 CSV 数据集执行训练/分类。

from jubakit.classifier import Classifier, Schema, Dataset, Config
from jubakit.loader.csv import CSVLoader

# Load a CSV file.
loader = CSVLoader('iris.csv')

# Define types for each column in the CSV file.
schema = Schema({
  'Species': Schema.LABEL,
}, Schema.NUMBER)

# Get the shuffled dataset.
dataset = Dataset(loader, schema).shuffle()

# Run the classifier service (`jubaclassifier` process).
classifier = Classifier.run(Config())

# Train the classifier.
for _ in classifier.train(dataset): pass

# Classify using the trained classifier.
for (idx, label, result) in classifier.classify(dataset):
  print("true label: {0}, estimated label: {1}".format(label, result[0][0]))

按主题示例

请参阅示例目录以获取工作示例。

示例

主题

需要 scikit-learn

classifier_csv.py

处理 CSV 文件和数值特征

classifier_shogun.py

处理 CSV 文件和字符串特征

classifier_digits.py

处理玩具数据集(数字)

classifier_libsvm.py

处理 LIBSVM 文件

classifier_kfold.py

K 折交叉验证和指标

classifier_parameter.py

寻找最佳超参数

classifier_hyperopt_tuning.py

使用 hyperopt 寻找最佳超参数

classifier_bulk.py

批量训练-测试分类器

classifier_twitter.py

处理 Twitter 流

classifier_model_extract.py

提取分类器模型文件的内容

classifier_sklearn_wrapper.py

使用 scikit-learn 包装器进行分类

classifier_sklearn_grid_search.py

使用 scikit-learn 包装器进行网格搜索的示例

classifier_tensorboard.py

使用 TensorBoard 可视化训练过程

regression_boston.py

使用玩具数据集(波士顿)进行回归

regression_csv.py

使用 CSV 文件进行回归

regression_sklearn_wrapper.py

使用 scikit-learn 包装器进行回归

anomaly_auc.py

异常检测和指标

recommender_npb.py

推荐相似项

nearest_neighbor_aaai.py

搜索邻居项

clustering_2d.py

聚类二维数据集

burst_dummy_stream.py

使用流数据进行突发检测

bandit_slot.py

多臂老虎机示例

weight_shogun.py

使用 Weight 追踪 fv_converter 行为

weight_model_extract.py

提取 Weight 模型文件的内容

许可证

MIT 许可证

项目详情


下载文件

下载您平台的文件。如果您不确定要选择哪个,请了解有关安装包的更多信息。

源分布

jubakit-0.6.2.tar.gz (57.0 kB 查看哈希值)

上传时间: 源代码

支持者