跳转到主要内容

CSV GP 允许您定位CSV文件中的常见问题,以及仅从文件中导出可解析的行。

项目描述

CSV GP:诊断您的所有CSV问题

CSV是数据传输的通用格式,通常存在很多问题。大多数CSV库在遇到错误时只会中断而不会提供有用的错误信息,CSV GP 允许您定位CSV文件中的常见问题,以及仅从文件中导出可解析的行。

安装

CSV GP 可以以三种方式使用。

独立二进制文件

  1. 安装rust
  2. 克隆仓库并进入
  3. 运行 cargo install --path csv_gp
  4. csv-gp 命令现在可以运行,请参阅 csv-gp --help 了解用法。

Rust 库

请将以下内容添加到您的 Cargo.toml

csv-gp = { git = "https://github.com/xelixdev/csv-gp", rev = "<可选的 git 标签>" }

Python 库

从包管理器

该库可在 PyPI 上找到,网址为 https://pypi.ac.cn/project/csv-gp/,因此您可以只需运行

pip install csv-gp

从源代码编译

  1. 安装rust
  2. 安装 (pip install maturin)
  3. 克隆仓库
  4. 运行 make all
  5. cd csv_gp_python && maturin develop

用法

Rust 独立二进制文件

安装二进制文件后,默认用法是运行 csv-gp $FILE。这将打印出文件的诊断信息。该命令提供选项以更改文件的分隔符和编码。有关详细信息,请参阅 csv-gp -h

提供的另一个选项是 --correct-rows-path,它将仅将正确的行导出到提供的路径。

Python 库

Python 库公开了两个主要函数,check_fileget_rows

check_file 函数接受文件的路径、分隔符和编码(见 https://github.com/xelixdev/csv-gp/blob/0f77c62841509c134a3bbe06ec178426e9c5aa10/csv_gp_python/csv_gp.pyi),并返回一个 CSVDetails 类的实例,该实例提供有关文件的信息。请参阅同一文件以查看所有可用属性及其名称/类型。如果函数提供了 valid_rows_output_path 参数,则仅将正确的行导出到该路径。

get_rows 再次接受文件的路径、分隔符和编码,以及行号列表。该函数将返回给定行的解析单元格。请参阅上述文件以获取参数和返回值的精确类型。

发布 Python 库的新版本

  1. 更新 csv_gp_python/Cargo.tomlcsv_gp/Cargo.toml 中的版本号
  2. 将此更改合并到 main
  3. 在 GitHub 上创建一个新的发布,创建形式为 vX.Y.Z 的标签
  4. '发布' 管道应开始运行,并将新版本发布

运行测试

运行 Rust 测试

运行 cargo test

运行 Python 测试

遵循编译源代码的说明。然后您可以运行 pytest

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

csv_gp-0.2.1.tar.gz (24.0 kB 查看哈希值)

上传时间 源代码

构建分发

csv_gp-0.2.1-cp37-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (476.1 kB 查看哈希值)

上传时间 CPython 3.7+ manylinux: glibc 2.17+ x86-64

支持者