从双精度到四(或更高)精度,
- 大致上有多少对各种架构和框架的性能影响。浮点运算需要两倍的时间吗?十倍的时间?一百倍的时间?
- 目前有哪些框架支持四精度以进行大规模计算?
我对有关使用双精度的四精度软件模拟以及在硬件中本地完成的四精度的答案感兴趣。
免责声明:显然给定一个需要四精度的问题,第一步是尝试重新构造或重组它,使其不再需要四精度。假设为了回答这个问题,这种问题的重新表述是不可能的,并且确实需要四倍精度。
从双精度到四(或更高)精度,
我对有关使用双精度的四精度软件模拟以及在硬件中本地完成的四精度的答案感兴趣。
免责声明:显然给定一个需要四精度的问题,第一步是尝试重新构造或重组它,使其不再需要四精度。假设为了回答这个问题,这种问题的重新表述是不可能的,并且确实需要四倍精度。
这取决于如何实现四精度。如果您想将其实现为带有符号、尾数和指数的“传统”浮点数(后两者仅具有超过正常的 53 位和 10 位双精度),那么在本机不具备的处理器上执行此操作支持它,将非常昂贵,因为它会涉及很多摆弄。
另一方面,一些 ABI 通过表示四精度数来实现四精度作为在哪里大致等于双精度的机器精度。在这种情况下,四精度的加法和乘法可以以双精度的 2-4 的成本实现,因为将两个这样的数字相加或相乘只涉及添加或乘以它们各自的组件。