跳转到主要内容

支持将机器学习模型简化应用于材料科学数据集的软件包

项目描述

PyPI Tests Tests NSF-1931306

Foundry-ML简化了在材料科学和化学中查找和使用ML-ready数据集的过程,提供了一个简单的API来访问复杂的数据集。

  • 只需几行代码即可加载ML-ready数据
  • 在本地或云环境中处理数据集。
  • 使用Foundry发布您自己的数据集以促进社区使用
  • (进行中) 无烦恼地运行发布的ML模型

了解更多信息并查看我们的可用数据集,请访问Foundry-ML.org

文档

有关如何安装和使用Foundry的信息,请参阅我们的文档此处

DLHub文档,包括模型发布和运行信息,可在此处找到。

快速入门

使用命令行安装Foundry-ML: pip install foundry_ml

您可以使用以下代码导入和实例化Foundry-ML,然后加载一个数据集。

from foundry import Foundry
f = Foundry(index="mdf")


f = f.load("10.18126/e73h-3w6n", globus=True)

注意:如果您在本地运行且不想安装Globus Connect Personal端点,只需设置globus=False

如果在笔记本中运行此代码,将显示数据集的元数据表格

metadata

我们可以使用f.load_data()来使用数据,并指定如train等分割,然后使用matplotlib来可视化。

res = f.load_data()

imgs = res['train']['input']['imgs']
desc = res['train']['input']['metadata']
coords = res['train']['target']['coords']

n_images = 3
offset = 150
key_list = list(res['train']['input']['imgs'].keys())[0+offset:n_images+offset]

fig, axs = plt.subplots(1, n_images, figsize=(20,20))
for i in range(n_images):
    axs[i].imshow(imgs[key_list[i]])
    axs[i].scatter(coords[key_list[i]][:,0], coords[key_list[i]][:,1], s = 20, c = 'r', alpha=0.5)
Screen Shot 2022-10-20 at 2 22 43 PM

查看完整示例

贡献

Foundry是一个开源项目,我们鼓励社区贡献。要贡献,请从main分支分叉并打开main分支的Pull Request。我们的团队成员将很快审查您的PR。

开发者注意

为了确保与外部元数据和datacite结构(包含在MDF数据方案存储库中)的一致性,使用了datamodel-code-generator工具生成了dc_model.pyproject_model.py pydantic数据模型(位于foundry/jsonschema_models文件夹中)。为了确保符合flake8代码检查,传递了--use-annoted标志以确保在dc_model.py中使用的正则表达式模式采用pydantic的Annotated类型而不是即将弃用的constr类型。运行datamodel-code-generator的命令如下

datamodel-codegen --input dc.json --output dc_model.py --use-annotated

主要支持

这项工作得到了美国国家科学基金会(NSF)的资助,资助编号:1931306 "协作研究:框架:机器学习材料创新基础设施"。

其他支持

Foundry-ML汇集了材料数据生态系统中许多组件。包括MAST-ML,科学数据和学习中心(DLHub),以及材料数据设施(MDF)。

MAST-ML

这项工作得到了美国国家科学基金会(NSF)SI2奖项No. 1148011和DMREF奖项号DMR-1332851的支持

科学数据和学习中心(DLHub)

本材料基于美国阿贡国家实验室实验室定向研究与发展(LDRD)资助的工作,由美国能源部科学办公室主任提供,合同号DE-AC02-06CH11357。https://www.dlhub.org

材料数据设施

这项工作是在美国商务部国家标准和技术研究院(NIST)的财务援助奖号70NANB14H012的资助下进行的,作为层次材料设计中心(CHiMaD)的一部分。这项工作是在以下财务援助奖号70NANB19H005的资助下进行的,作为层次材料设计中心(CHiMaD)的一部分。这项工作还得到了美国国家科学基金会(NSF)的支持,作为NSF奖项号1636950 "BD Spokes: SPOKE: MIDWEST: Collaborative: Integrative Materials Design (IMaD): Leverage, Innovate, and Disseminate"的一部分。https://www.materialsdatafacility.org

项目详情


下载文件

下载您平台上的文件。如果您不确定选择哪一个,请了解有关安装包的更多信息。

源代码分发

foundry_ml-1.0.4.tar.gz (38.1 kB 查看哈希值)

上传时间 源代码

构建分发

foundry_ml-1.0.4-py3-none-any.whl (42.5 kB 查看哈希值)

上传时间 Python 3

由以下支持