跳转到主要内容

未提供项目描述

项目描述

cinnabar(以前称为砷化物)

CI codecov Documentation Status DOI

报告相对自由能结果

问题:我们必须一致地报告统计数据,我们希望也一致地绘制这些结果。

解决方案:接受相对自由能结果的软件包,与任何特定的方法/系统或软件包无关。为此,输入应尽可能未转换。

用法

python cinnabar.py example.csv

选项

python cinnabar.py --help

术语

D是差异(即相对)而d是方差(即误差条),dDG将是绝对FE的方差,DDG将是两个分子之间的相对自由能。

输出图表

有两种思考自由能模拟结果的方式,一种是将自己视为方法开发者,关注模拟与真实实验值之间的距离。另一种是将自己视为药物开发者——这个方法的所有信息实际上如何帮助我选择下一个分子。统计信息应确实打印在图表上。

DDG的

这些应代表主要数据(即方法开发者),相对自由能模拟的输出。关于如何最好地报告这些数据,仍有讨论。需要决定的问题包括

  • 我们应该只报告边缘运行还是所有边缘

  • 我们应该进行对称化

    如果我们只报告我们运行的边缘,那么比较不同集合的同一系统的结果会更困难——即如果我运行所有简单边缘,我看起来会比运行更多结果的另一种方法更好。绘制所有边缘可以解决这个问题,但这会使我们离主要数据更远,并且与DG图有些重复。

    相关统计量取决于边选择的符号,因此如果我们需要报告这些,对称化是唯一使这些稳健的方法。一个解决方案既不进行对称化也不报告相关统计量(仅针对这些图报告RMSE和AUE)。

    如果我们使用这些原始数据图,那么应该非常清楚地显示哪些边正在被绘制,以便我们知道我们是在比较一个网络还是另一个网络。也许应该附加一个networkX图。

DG的

这些应代表总体结果(即针对药物设计师),其中相对自由能应一致地结合(即使用MLE)以将可用的DDG转换为DG。由于这些图上只能有Nligand个数据点,因此可以使用任何统计量,但可能排名顺序指标最有用。

统计

  • RMSE - 这很好

  • MUE - 当比较靶点之间时,它存在一些问题,因为它取决于动态范围(由C. Bayly指出),但在比较方法之间时较少。C. Bayly建议相对绝对误差。此外,GSK的GRAM将是一个很好的衡量标准来纳入(《GRAM:相对结合亲和力预测的真正零模型 | 化学信息与建模杂志》)

  • R2/Kendall等(相关系数)- 使用这些统计量与一些DDG图存在一些问题,并且与DG结果相比具有更有用的意义(参见1examples/WhyNotToUseR2ForDDG.ipynb`)

错误

我们如何比较错误?有几个来源

  • MBAR

  • 重复(相同的模拟再次进行)

  • 重复(正向/反向类型)

  • 循环封闭

  • 其他来源(?)

我们希望一致地处理这些。软件的输入应有两个错误(a)由PYMBAR生成,因为这些是既定标准;(b)另一列包含可能生成的其他错误,可用于尝试补偿MBAR错误的低估。

绘图样式 - 可能无法完全就绘图样式达成一致(也许也不必要)

颜色?色盲友好?

距离相等的不同颜色(如David Hahn/de Groot实验室)?

误差线样式?

从相等单位的指南?

待办事项(将其移动到项目板)

生成人们满意的一组图表。添加MUE的gram分析。将边误差纳入bootstrap。正确处理重复和正反向边。也要有绝对自由能的入口点。查看其他成功指标的图,例如误差的直方图?(类似于METK的图?)目前只是将所有内容与实验数据进行比较,希望进行力场X与力场Y的比较

版权

版权(c)2021,Hannah Bruce Macdonald

致谢

基于计算分子科学Python Cookiecutter版本1.1的项目。

项目详情


发布历史 发布通知 | RSS源

下载文件

为您的平台下载文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。

源分布

cinnabar-0.2.3.tar.gz (37.3 kB 查看哈希值)

上传时间

构建分布

cinnabar-0.2.3-py3-none-any.whl (22.0 kB 查看哈希值)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面