未提供项目描述
项目描述
cinnabar(以前称为砷化物)
报告相对自由能结果
问题:我们必须一致地报告统计数据,我们希望也一致地绘制这些结果。
解决方案:接受相对自由能结果的软件包,与任何特定的方法/系统或软件包无关。为此,输入应尽可能未转换。
用法
python cinnabar.py example.csv
选项
python cinnabar.py --help
术语
D是差异(即相对)而d是方差(即误差条),dDG将是绝对FE的方差,DDG将是两个分子之间的相对自由能。
输出图表
有两种思考自由能模拟结果的方式,一种是将自己视为方法开发者,关注模拟与真实实验值之间的距离。另一种是将自己视为药物开发者——这个方法的所有信息实际上如何帮助我选择下一个分子。统计信息应确实打印在图表上。
DDG的
这些应代表主要数据(即方法开发者),相对自由能模拟的输出。关于如何最好地报告这些数据,仍有讨论。需要决定的问题包括
-
我们应该只报告边缘运行还是所有边缘
-
我们应该进行对称化
如果我们只报告我们运行的边缘,那么比较不同集合的同一系统的结果会更困难——即如果我运行所有简单边缘,我看起来会比运行更多结果的另一种方法更好。绘制所有边缘可以解决这个问题,但这会使我们离主要数据更远,并且与DG图有些重复。
相关统计量取决于边选择的符号,因此如果我们需要报告这些,对称化是唯一使这些稳健的方法。一个解决方案既不进行对称化也不报告相关统计量(仅针对这些图报告RMSE和AUE)。
如果我们使用这些原始数据图,那么应该非常清楚地显示哪些边正在被绘制,以便我们知道我们是在比较一个网络还是另一个网络。也许应该附加一个networkX图。
DG的
这些应代表总体结果(即针对药物设计师),其中相对自由能应一致地结合(即使用MLE)以将可用的DDG转换为DG。由于这些图上只能有Nligand个数据点,因此可以使用任何统计量,但可能排名顺序指标最有用。
统计
-
RMSE - 这很好
-
MUE - 当比较靶点之间时,它存在一些问题,因为它取决于动态范围(由C. Bayly指出),但在比较方法之间时较少。C. Bayly建议相对绝对误差。此外,GSK的GRAM将是一个很好的衡量标准来纳入(《GRAM:相对结合亲和力预测的真正零模型 | 化学信息与建模杂志》)
-
R2/Kendall等(相关系数)- 使用这些统计量与一些DDG图存在一些问题,并且与DG结果相比具有更有用的意义(参见1examples/WhyNotToUseR2ForDDG.ipynb`)
错误
我们如何比较错误?有几个来源
-
MBAR
-
重复(相同的模拟再次进行)
-
重复(正向/反向类型)
-
循环封闭
-
其他来源(?)
我们希望一致地处理这些。软件的输入应有两个错误(a)由PYMBAR生成,因为这些是既定标准;(b)另一列包含可能生成的其他错误,可用于尝试补偿MBAR错误的低估。
绘图样式 - 可能无法完全就绘图样式达成一致(也许也不必要)
颜色?色盲友好?
距离相等的不同颜色(如David Hahn/de Groot实验室)?
误差线样式?
从相等单位的指南?
待办事项(将其移动到项目板)
生成人们满意的一组图表。添加MUE的gram分析。将边误差纳入bootstrap。正确处理重复和正反向边。也要有绝对自由能的入口点。查看其他成功指标的图,例如误差的直方图?(类似于METK的图?)目前只是将所有内容与实验数据进行比较,希望进行力场X与力场Y的比较
版权
版权(c)2021,Hannah Bruce Macdonald
致谢
基于计算分子科学Python Cookiecutter版本1.1的项目。
项目详情
下载文件
为您的平台下载文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。