关于阿姆达尔的平衡系统定律

计算科学 高性能计算 io 多核
2021-12-28 18:00:09

其中一篇题为“数据工程中的经验法则”(Jim Gray 等人)的论文提到了一些基于 Amdahl 平衡系统定律的计算。

论文链接:https ://www.microsoft.com/en-us/research/wp-content/uploads/2016/02/ms_tr_99_100_rules_of_thumb_in_data_engineering.pdf

最初,本文提供了一些经验法则。

"10. Amdahl 修正的平衡系统定律:一个系统需要 8 MIPS/MBpsIO,但指令率和 IO 率必须在相关工作负载上衡量。(顺序工作负载往往具有较低的 CPI(每指令时钟数),而随机工作负载往往有更高的 CPI。)

  1. Alpha(MB/MIPS 比率)从 1 上升到 4。这种趋势可能会持续下去。

  2. 随机 IO 大约每 50,000 条指令发生一次。根据规则 10,顺序 IO 更大,因此对于顺序工作负载,每个 IO 的指令要高得多。”

后来,本文提供了以下示例。

“Amdahl 的平衡系统定律在四问题流水线处理器的新世界中解释变得更加复杂。表 2 总结了以下分析。理论上,当前 550 MHz 的 Intel 处理器每秒能够执行 20 亿条指令,因此 Amdahl 的 IO法律建议每个 550 MHz 处理器需要160 MBps磁盘带宽(所有数字四舍五入)。然而,在实际基准测试中,这些处理器在顺序工作负载(TPC-D、H、R)上展示了每条指令 1.2 个时钟(CPI),在随机 IO 工作负载(TPC-C、W)上展示了每条指令 2.2 个时钟 [7,8]。这些较大的 CPI 在顺序工作负载上转换为 450 MIPS,在随机工作负载上转换为 260 MIPS。反过来,阿姆达尔定律表明,这些处理器分别需要 60 MBps 的顺序 IO 带宽 (~450/8) 和 30 MBps 的随机 IO 带宽 (~260/8) 每个 cpu(对于 tpcH 和 tpcC)。HP [5] 最近的一项 tpcH 基准测试使用了 8 个 550 MHz 处理器和 176 个磁盘。这意味着每个 cpu 有 22 个磁盘,或者每个 cpu 大约70 MBps 的原始磁盘带宽和每个 cpu 120 MBps 的控制器带宽(与 Amdahl 的60MBps预测一致)。Amdahl 定律预测系统需要 30MBps 的 IO 带宽。使用 8KB 页面和每个磁盘 100 IO/s 意味着每个处理器 38 个磁盘——这个数字与戴尔实际使用的 50 个磁盘相当 [4]。”

我无法理解其中的两个部分(以粗体标记)。需要帮助来理解它。

1)。Amdahl 的 IO 定律如何在这里建议 160 MBps(或者是稍后指出的 60MBps(粗体))?

一种。根据 Amdahl 的 IO 定律,50,000 条指令将需要 1 个 IO(但大小是多少??)

湾。因此,20 亿条指令 (= 2 * 10^9 instrs = (50,000) * (40,000)) 将需要 40,000 个 IO(但大小是多少?)

C。我们是否应该将这 40,000 乘以 4(因为四问题流水线处理器)?这将提供 160,000 个 IO。

d。我们应该为每个 IO 假设 1000 字节吗?如果是这种情况,它将提供 160MBps !

e. 在这之后我迷路了。我在 (c) 和 (d) 中的假设是否正确?请帮忙

2) HP 的 tpcH 基准测试如何转换为每个 cpu 70MBps 的原始磁盘带宽和每个 cpu 120 MBps 的控制器带宽?

一种。我可以理解,如果 176 个磁盘与 8 个处理器一起使用,那么每个 cpu 大约 22 个磁盘。

湾。但是,这如何转化为每个 cpu 70MBps 的原始磁盘带宽和每个 cpu 120MBps 的控制器带宽?

0个回答
没有发现任何回复~