项目简介
本项目是一款用于评估矩阵乘法性能的工具,支持ARM53和x86_64架构。该工具通过对不同数据类型(双精度浮点、单精度浮点以及32位整数)的矩阵乘法操作进行计算,估算出每秒完成的浮点操作数(GFLOPS),以此来评估计算机的性能。
项目的主要特性和功能
- 多数据类型支持:可对双精度浮点、单精度浮点和32位整数类型的矩阵乘法进行性能测试。
- 架构兼容性:适用于ARM53和x86_64架构,用户能依据自身硬件选择合适的编译选项。
- 简单易用:提供清晰的测试结果,包含操作时间及GFLOPS性能评估。
安装使用步骤
假设用户已经下载了本项目的源码文件,可按以下步骤操作:
1. 选择Makefile:根据使用的架构选择合适的Makefile文件(如Makefile.arm53
或Makefile.x86_64
)。
2. 编译项目:在终端中运行以下命令进行编译:
sh
$ make -f Makefile.arm53 # 对于ARM53架构
$ make -f Makefile.x86_64 # 对于x86_64架构
3. 运行测试:编译完成后,运行生成的可执行文件进行性能测试:
sh
$ ./p1.arm53 # 对于ARM53架构
$ ./p1.x86_64 # 对于x86_64架构
注意事项
- 本工具提供的性能评估仅供参考,实际性能可能因硬件、操作系统、编译器等因素而有所不同。
- 测试结果可能受到矩阵大小、重复次数等多种因素的影响。
样例结果展示
以下是在Raspberry Pi CM3和MacBook Pro 2018上的测试结果示例:
Raspberry Pi CM3
sh
DGEMM: 0.886263 GFLOPS ( 677 [ms] )
SGEMM: 2.18978 GFLOPS ( 274 [ms] )
IGEMM: 2.47934 GFLOPS ( 242 [ms] )
MacBook Pro 2018 (2.7 GHz Intel Core i7)
sh
DGEMM: 33.3333 GFLOPS ( 18 [ms] )
SGEMM: 75 GFLOPS ( 8 [ms] )
IGEMM: 22.2222 GFLOPS ( 27 [ms] )
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】