pandas-streaming

Array (and numpy) API for ONNX

These details have not been verified by PyPI

Project links

Homepage

Project description

https://dl.circleci.com/status-badge/img/gh/sdpython/pandas-streaming/tree/main.svg?style=svg

https://dev.azure.com/xavierdupre3/pandas_streaming/_apis/build/status/sdpython.pandas_streaming

https://badge.fury.io/py/pandas_streaming.svg

https://codecov.io/gh/sdpython/pandas-streaming/branch/main/graph/badge.svg?token=0caHX1rhr8

pandas-streaming aims at processing big files with pandas, too big to hold in memory, too small to be parallelized with a significant gain. The module replicates a subset of pandas API and implements other functionalities for machine learning.

from pandas_streaming.df import StreamingDataFrame
sdf = StreamingDataFrame.read_csv("filename", sep="\t", encoding="utf-8")

for df in sdf:
    # process this chunk of data
    # df is a dataframe
    print(df)

The module can also stream an existing dataframe.

import pandas
df = pandas.DataFrame([dict(cf=0, cint=0, cstr="0"),
                       dict(cf=1, cint=1, cstr="1"),
                       dict(cf=3, cint=3, cstr="3")])

from pandas_streaming.df import StreamingDataFrame
sdf = StreamingDataFrame.read_df(df)

for df in sdf:
    # process this chunk of data
    # df is a dataframe
    print(df)

It contains other helpers to split datasets into train and test with some weird constraints.

Algorithm	Hash digest
SHA256	`5693cd930d0b833aef5d2aa7873528a8fbe60b2f4575fe65499a2a05fc57381f`
MD5	`b0428843b387193bd50e7b5f40eacfbe`
BLAKE2b-256	`21f328a70d24df490849b5c4c93deacb3fb6674e928834a63f86edb05e071e5b`

Algorithm	Hash digest
SHA256	`a6ded7b7cc8f87a45e63c581bdc796fd37981182dbf3229b74e80b20385c5ba6`
MD5	`ea4f7fb97a23cfd455bfe3a8e0703a0a`
BLAKE2b-256	`0ae2fd3184612f13a4acbc1daf661a544118806a1b640b7561ba18a7928f243c`

pandas-streaming 0.5.0

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes