CSV GP 允许您定位CSV文件中的常见问题,以及仅从文件中导出可解析的行。
项目描述
CSV GP:诊断您的所有CSV问题
CSV是数据传输的通用格式,通常存在很多问题。大多数CSV库在遇到错误时只会中断而不会提供有用的错误信息,CSV GP 允许您定位CSV文件中的常见问题,以及仅从文件中导出可解析的行。
安装
CSV GP 可以以三种方式使用。
独立二进制文件
- 安装rust
- 克隆仓库并进入
- 运行
cargo install --path csv_gp
csv-gp
命令现在可以运行,请参阅csv-gp --help
了解用法。
Rust 库
请将以下内容添加到您的 Cargo.toml
csv-gp = { git = "https://github.com/xelixdev/csv-gp", rev = "<可选的 git 标签>" }
Python 库
从包管理器
该库可在 PyPI 上找到,网址为 https://pypi.ac.cn/project/csv-gp/,因此您可以只需运行
pip install csv-gp
从源代码编译
- 安装rust
- 安装 (
pip install maturin
) - 克隆仓库
- 运行
make all
cd csv_gp_python && maturin develop
用法
Rust 独立二进制文件
安装二进制文件后,默认用法是运行 csv-gp $FILE
。这将打印出文件的诊断信息。该命令提供选项以更改文件的分隔符和编码。有关详细信息,请参阅 csv-gp -h
。
提供的另一个选项是 --correct-rows-path
,它将仅将正确的行导出到提供的路径。
Python 库
Python 库公开了两个主要函数,check_file
和 get_rows
。
check_file 函数接受文件的路径、分隔符和编码(见 https://github.com/xelixdev/csv-gp/blob/0f77c62841509c134a3bbe06ec178426e9c5aa10/csv_gp_python/csv_gp.pyi),并返回一个 CSVDetails
类的实例,该实例提供有关文件的信息。请参阅同一文件以查看所有可用属性及其名称/类型。如果函数提供了 valid_rows_output_path
参数,则仅将正确的行导出到该路径。
get_rows 再次接受文件的路径、分隔符和编码,以及行号列表。该函数将返回给定行的解析单元格。请参阅上述文件以获取参数和返回值的精确类型。
发布 Python 库的新版本
- 更新
csv_gp_python/Cargo.toml
和csv_gp/Cargo.toml
中的版本号 - 将此更改合并到 main
- 在 GitHub 上创建一个新的发布,创建形式为
vX.Y.Z
的标签 - '发布' 管道应开始运行,并将新版本发布
运行测试
运行 Rust 测试
运行 cargo test
。
运行 Python 测试
遵循编译源代码的说明。然后您可以运行 pytest
。
项目详情
csv_gp-0.2.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9aedeb307f0d97bd1d8fdb5bd3ffac2a15cad2ca207f4ebb68da0fe05aab7668 |
|
MD5 | 2ee646580bfe047b82c2c1eda8e7733f |
|
BLAKE2b-256 | 63d689ff7ce764d72391388abcf72bbdf17d38a4687c1939d9a5476916d7ab87 |
csv_gp-0.2.1-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | c5dbf4371629470b287d43642baa40802c2e3f9439cd1e716b4d180149ca9882 |
|
MD5 | 0a24b9b8619099580d8ad8dc24e4539f |
|
BLAKE2b-256 | 7c120d02e5b3ee4ec5b2f84ce881954262345ffc5324ecaea1cdbcdf95d1edbd |