PySpark JIRA数据源
项目描述
PySpark JIRA数据源
pyspark-jira
是一个简单而强大的Python包,用于将JIRA与Apache Spark集成。此包允许用户无缝读取JIRA票据并创建Spark DataFrames,从而在Spark生态系统内实现高效的数据处理和分析。无论是管理敏捷工作流还是执行详细的项目分析,pyspark-jira
都可以轻松利用PySpark的强大功能来处理您的JIRA数据。
入门指南
安装
pip install pyspark-jira
用法
jira_username = "Your full email address that you used for logging in"
jira_api_token = "See https://id.atlassian.com/manage-profile/security"
jql_query = "project = 'ES'"
df = (
spark.read.format("jira")
.option("JIRA_USERNAME", jira_username)
.option("JIRA_API_TOKEN", jira_api_token)
.load(jql_query)
)
df.show()