神威
“不安的龙猫之光”计算机系统
高性能扩展数学库xMath 1.0
用户手册
dbdhm,qsddx,无限唇膏,dcdjzg,野性大神,cjdls
中国科学院软件研究所
并行软件&; 计算科学研究所
2016年6月15日
《不安的龙猫之光》计算机系统高性能扩展数学库xMath用户手册
目录
1系统概述2
2使用方法2
2.1链接方法2
2.2运行设定2
2.3如何排除错误消息3
3 BLAS模块3
3.1 BLAS LEVEL 1函数的说明4
3.2 BLAS LEVEL 2函数说明17
3.3 BLAS LEVEL 3函数的说明45
3.4 BLAS错误信息显示58
4 LAPACK模块59
4.1基本概况59
4.2子程序索引109
5 FFT模块120
5.1傅立叶变换120
5.2功能声明122
5.3描述符配置摘要127
6迭代求解器模块133
6.1 X MATH迭代求解器特点133
6.2迭代求解器函数列表134
6.3迭代解法器调用伪代码135
6.4迭代求解器参数介绍137
6.5迭代解法器函数界面介绍140
7绩效调整指导147
7.1玻璃模块147
7.2 LAPACK模块148
7.3 FFT模块148
7.4迭代求解器模块149
8参考文献149
I
《不安的龙猫之光》计算机系统高性能扩展数学库xMath用户手册
1系统概述
“令人不安的龙猫之光”计算机系统高性能扩展数学库xMath (众人核版和片上多核版) ) ) ) )。
运行在国产申威CPU上,支持申威伧核新处理器特点,具有单核组伧核并行化
片上多核和特征并行化,并掌握源代码的扩展数学库。 在该库的研发过程中,对国产
CPU研究了一系列数学库性能优化的关键技术和框架利用这些关键技术进行性能优化,
提高数学库整体性能。
该软件包括五个子模块:
BLAS;
LAPACK 3.5.0;
FFT信号处理子程序;
稀疏线性系统求解子程序包
ScaLAPACK 2.0.2。
其中,ScaLAPACK模块未对本软件进行更改,请参阅其用户手册。 本用户手册针对每一个
剩下的4个模块进行介绍和函数的说明等。
2使用方法
2.1链接方法
必须使用sw5f90链接此库,并且内部使用内核函数,因此必须添加-hybrid参数。
例如以下所示。
1 )编译用户程序主核程序
sw5cc -host -o test.o test.c
2 )链接
sw5f 90-hybrid-otesttest.o-l/path/to/x math-LX math
2