未提供项目描述
项目描述
描述
mympingpong 是一个基于 mpi4py 的随机成对 pingpong 网络压力测试。
安装
我们建议使用 [EasyBuild][eb_url] 自动安装 mympingpong
及其依赖项。
所需步骤包括构建修补过的 mpi4py 和并行启用 h5py。有关手动安装这些内容的说明,请参阅 manual/install_insructions。
用法
成功安装后,只需提交一个运行以下内容的作业
mympirun mympingpong -f output_dir -i nr_iterations -n nr_tests_per_rank
依赖项
(包括但不限于)
- numpy >= 1.8.2
- vsc-base >= 1.8.6
- matplotlib >= 1.3.1
- h5py >= 2.5.0
示例
mympingponganalysis 的最终结果是对所有成对的 pingpong 往返时间 (RTT) 的可视化表示。这可以揭示架构和/或拓扑(或与之相关的问题)。
示例输出
每个图表最多 5 个图表
- 最大图表:每个数据点是成对 (x,y) 之间的平均 pingpong RTT,其中 x 和 y 是 MPI 排名。
- 所有 pingpong RTT 的直方图
- 在 (x,y) 对上运行的 pingpong 的数量热图
- 从 (x,y) 对上运行的测试数据的标准差热图
- 如果已使用掩码,则掩码间隔内所有 pingpong RTT 的直方图
每个节点上的唯一MPI进程
在128个节点上运行pingpong的结果,每个进程固定在核心0。延迟图清楚地显示了哪些进程位于同一个交换机上。标准差图显示,32-48号进程似乎存在问题。
每个进程固定在唯一的核心上
在4个节点上,每个节点有16个核心运行pingpong的结果。在这个例子中,NUMA节点是可见的。节点间通信比节点内通信慢,但仅慢3-5倍。直方图显示了3个区域:共享L2缓存、芯片内和芯片间。在延迟图中,交换机也以绿色阴影的形式出现。
超频
在4个节点上,每个节点有16个核心的情况下,每个节点运行32个进程的结果
充分发挥PingPong的潜力
您应该始终注意确保每个对有足够的样本。换句话说,-n参数应该足够高,以确保每个进程都有一致的结果。快速检查是否达到一致结果的方法是当对样本图呈现深红色时
知道存在问题可能是有用的,但您更有可能想知道问题所在的位置。有关哪些进程被固定在哪个节点上的哪个核心的信息包含在输出文件中,但此数据不会用mympingponganalysis绘制。使用h5dump或其他HDF5文件阅读器打开它以访问此数据。
项目详情
关闭
mympingpong-0.8.1.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 118605f8d458c5de289af5a80dcb69904907f638e3b3635b5dec056a6a650b1b |
|
MD5 | 570542ccbeb0d29d9fad9f19c1e18160 |
|
BLAKE2b-256 | 6572b0892278046bf4cfe38f73a5d02789ca4f5547d773f17afae4d6e86cff0d |