用于在Python和ElasticSearch中处理数据流的实用程序库
项目描述
dataflows-elasticsearch
Dataflows的处理器用于与ElasticSearch协同工作
特性
dump_to_elasticsearch
处理器
内容
入门
安装
该包使用语义版本控制。这意味着主版本可能包含破坏性更改。建议在您的setup/requirements
文件中指定package
版本范围,例如package>=1.0,<2.0
。
$ pip install dataflows-elasticsearch
示例
这些处理器必须作为dataflows Flow
的一部分使用。例如
flow = Flow(
load('data/data.csv'),
dump_to_es(
engine='localhost:9200',
),
)
flow.process()
文档
dump_to_es
将Flow保存到ElasticSearch索引中。
参数
indexes
- 索引名称到资源名称的映射,例如
{
'index-name-1': {
'resource-name': 'resource-name-1',
},
'index-name-2': {
'resource-name': 'resource-name-2',
},
# ...
}
mapper_cls
- 用于将JSON表模式类型映射到ElasticSearch类型的类index_settings
- 在创建ElasticSearch索引时使用的选项engine
- 连接到ElasticSearch实例的连接字符串,或一个Elasticsearch
对象。也可以是env://ENV_VAR
的形式,在这种情况下,连接字符串将从环境变量ENV_VAR
中获取。elasticsearch_options
- 创建Elasticsearch
对象时要使用的选项(如果未提供)
贡献
项目遵循 Open Knowledge International 编码标准。
开始推荐的步骤是创建并激活一个项目虚拟环境。要将软件包和开发依赖项安装到您的活动环境中
$ make install
运行带有代码审查和覆盖率的测试
$ make test
对于代码审查,使用 pylama
(在 pylama.ini
中配置)。在此阶段,它已经安装到您的环境中,可以像在文档中描述的那样单独使用,具有更细粒度的控制 - https://pylama.readthedocs.io/en/latest/。
例如,按错误类型排序结果
$ pylama --sort <path>
对于测试,使用 tox
(在 tox.ini
中配置)。它已经安装到您的环境中,可以像在文档中描述的那样单独使用,具有更细粒度的控制 - https://testrun.org/tox/latest/。
例如,以增加的详细程度检查与Python 2环境的测试子集。所有位置参数和 --
后面的选项都将传递给 py.test
tox -e py37 -- -v tests/<path>
在底层,tox
使用 pytest
(在 pytest.ini
中配置),coverage
和 mock
包。这些包仅可在 tox
环境中使用。
变更日志
所有已发布版本的完整变更日志和文档可以在格式良好的 提交历史 中找到。
项目详情
关闭
dataflows-elasticsearch-0.1.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 56ca064baea3453f7d5e497531c20bd6afdfbc89b5ce846b74f154f2fef4dd38 |
|
MD5 | 6bee4d829377cef6c1a0e21cac7c9fb8 |
|
BLAKE2b-256 | 6e6ad2ddf5cc72d204f9d960ded7e44be44fafd7cc08e01fbad0e843b4a2751a |
关闭
dataflows_elasticsearch-0.1.1-py2.py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 002578ed127c1ac2e357bbb3f524cd62b79c50424972efbc203710e554a9911c |
|
MD5 | 504f62a75680b0b664f0a7ac22de2eee |
|
BLAKE2b-256 | c362914c1b0554eff8192b9f69b7f312e9077d107d167070b9fa9f312945f331 |