Jubatus工具包
项目描述
jubakit: Jubatus 工具包
jubakit 是一个用于轻松访问 Jubatus 特性的 Python 模块。jubakit 可以与 scikit-learn 结合使用,以便您可以使用交叉验证和模型评估等强大功能。请参阅Jubakit 文档以获取详细描述。
目前 jubakit 支持 分类器、回归、异常、推荐、最近邻、聚类、突发、多臂老虎机和权重引擎。
安装
pip install jubakit
要求
Python 2.7、3.3、3.4 或 3.5。
Jubatus 需要安装。
尽管不是必需的,但为了使用诸如 K 折交叉验证等一些功能,需要安装scikit-learn。
快速入门
以下示例展示了如何使用 CSV 数据集执行训练/分类。
from jubakit.classifier import Classifier, Schema, Dataset, Config
from jubakit.loader.csv import CSVLoader
# Load a CSV file.
loader = CSVLoader('iris.csv')
# Define types for each column in the CSV file.
schema = Schema({
'Species': Schema.LABEL,
}, Schema.NUMBER)
# Get the shuffled dataset.
dataset = Dataset(loader, schema).shuffle()
# Run the classifier service (`jubaclassifier` process).
classifier = Classifier.run(Config())
# Train the classifier.
for _ in classifier.train(dataset): pass
# Classify using the trained classifier.
for (idx, label, result) in classifier.classify(dataset):
print("true label: {0}, estimated label: {1}".format(label, result[0][0]))
按主题示例
请参阅示例目录以获取工作示例。
示例 |
主题 |
需要 scikit-learn |
---|---|---|
classifier_csv.py |
处理 CSV 文件和数值特征 |
|
classifier_shogun.py |
处理 CSV 文件和字符串特征 |
|
classifier_digits.py |
处理玩具数据集(数字) |
✓ |
classifier_libsvm.py |
处理 LIBSVM 文件 |
✓ |
classifier_kfold.py |
K 折交叉验证和指标 |
✓ |
classifier_parameter.py |
寻找最佳超参数 |
✓ |
classifier_hyperopt_tuning.py |
使用 hyperopt 寻找最佳超参数 |
✓ |
classifier_bulk.py |
批量训练-测试分类器 |
|
classifier_twitter.py |
处理 Twitter 流 |
|
classifier_model_extract.py |
提取分类器模型文件的内容 |
|
classifier_sklearn_wrapper.py |
使用 scikit-learn 包装器进行分类 |
✓ |
classifier_sklearn_grid_search.py |
使用 scikit-learn 包装器进行网格搜索的示例 |
✓ |
classifier_tensorboard.py |
使用 TensorBoard 可视化训练过程 |
✓ |
regression_boston.py |
使用玩具数据集(波士顿)进行回归 |
✓ |
regression_csv.py |
使用 CSV 文件进行回归 |
|
regression_sklearn_wrapper.py |
使用 scikit-learn 包装器进行回归 |
✓ |
anomaly_auc.py |
异常检测和指标 |
|
recommender_npb.py |
推荐相似项 |
|
nearest_neighbor_aaai.py |
搜索邻居项 |
|
clustering_2d.py |
聚类二维数据集 |
|
burst_dummy_stream.py |
使用流数据进行突发检测 |
|
bandit_slot.py |
多臂老虎机示例 |
|
weight_shogun.py |
使用 Weight 追踪 fv_converter 行为 |
|
weight_model_extract.py |
提取 Weight 模型文件的内容 |
许可证
MIT 许可证
项目详情
jubakit-0.6.2.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c88c8a71b7ce0cf829acf9c6690aeef77150f9982f6f52b7238772803c3f85a9 |
|
MD5 | bcc4e0d0e63b735e4bd409dabc1d1c9f |
|
BLAKE2b-256 | 7454ca9bc2f9a637d53097d8da5607f0a4a56c6073a3b51d7f002b9bcc9d5219 |