支持将机器学习模型简化应用于材料科学数据集的软件包
项目描述
Foundry-ML简化了在材料科学和化学中查找和使用ML-ready数据集的过程,提供了一个简单的API来访问复杂的数据集。
- 只需几行代码即可加载ML-ready数据
- 在本地或云环境中处理数据集。
- 使用Foundry发布您自己的数据集以促进社区使用
- (进行中) 无烦恼地运行发布的ML模型
了解更多信息并查看我们的可用数据集,请访问Foundry-ML.org
文档
有关如何安装和使用Foundry的信息,请参阅我们的文档此处。
DLHub文档,包括模型发布和运行信息,可在此处找到。
快速入门
使用命令行安装Foundry-ML: pip install foundry_ml
您可以使用以下代码导入和实例化Foundry-ML,然后加载一个数据集。
from foundry import Foundry
f = Foundry(index="mdf")
f = f.load("10.18126/e73h-3w6n", globus=True)
注意:如果您在本地运行且不想安装Globus Connect Personal端点,只需设置globus=False
。
如果在笔记本中运行此代码,将显示数据集的元数据表格
我们可以使用f.load_data()
来使用数据,并指定如train
等分割,然后使用matplotlib来可视化。
res = f.load_data()
imgs = res['train']['input']['imgs']
desc = res['train']['input']['metadata']
coords = res['train']['target']['coords']
n_images = 3
offset = 150
key_list = list(res['train']['input']['imgs'].keys())[0+offset:n_images+offset]
fig, axs = plt.subplots(1, n_images, figsize=(20,20))
for i in range(n_images):
axs[i].imshow(imgs[key_list[i]])
axs[i].scatter(coords[key_list[i]][:,0], coords[key_list[i]][:,1], s = 20, c = 'r', alpha=0.5)
贡献
Foundry是一个开源项目,我们鼓励社区贡献。要贡献,请从main
分支分叉并打开main
分支的Pull Request。我们的团队成员将很快审查您的PR。
开发者注意
为了确保与外部元数据和datacite结构(包含在MDF数据方案存储库中中)的一致性,使用了datamodel-code-generator工具生成了dc_model.py
和project_model.py
pydantic数据模型(位于foundry/jsonschema_models
文件夹中)。为了确保符合flake8代码检查,传递了--use-annoted
标志以确保在dc_model.py
中使用的正则表达式模式采用pydantic的Annotated
类型而不是即将弃用的constr
类型。运行datamodel-code-generator的命令如下
datamodel-codegen --input dc.json --output dc_model.py --use-annotated
主要支持
这项工作得到了美国国家科学基金会(NSF)的资助,资助编号:1931306 "协作研究:框架:机器学习材料创新基础设施"。
其他支持
Foundry-ML汇集了材料数据生态系统中许多组件。包括MAST-ML,科学数据和学习中心(DLHub),以及材料数据设施(MDF)。
MAST-ML
这项工作得到了美国国家科学基金会(NSF)SI2奖项No. 1148011和DMREF奖项号DMR-1332851的支持
科学数据和学习中心(DLHub)
本材料基于美国阿贡国家实验室实验室定向研究与发展(LDRD)资助的工作,由美国能源部科学办公室主任提供,合同号DE-AC02-06CH11357。https://www.dlhub.org
材料数据设施
这项工作是在美国商务部国家标准和技术研究院(NIST)的财务援助奖号70NANB14H012的资助下进行的,作为层次材料设计中心(CHiMaD)的一部分。这项工作是在以下财务援助奖号70NANB19H005的资助下进行的,作为层次材料设计中心(CHiMaD)的一部分。这项工作还得到了美国国家科学基金会(NSF)的支持,作为NSF奖项号1636950 "BD Spokes: SPOKE: MIDWEST: Collaborative: Integrative Materials Design (IMaD): Leverage, Innovate, and Disseminate"的一部分。https://www.materialsdatafacility.org
项目详情
下载文件
下载您平台上的文件。如果您不确定选择哪一个,请了解有关安装包的更多信息。