py torch 1.8版自2020年10月1.7日发布以来,已收集了3000多次GitHub提交。 但是,最令人高兴的是,政府终于加入了对AMD ROCm的支持,无需配置Docker即可在本机环境中轻松运行。
请注意,AMD ROCm只支持Linux操作系统。 另外,这次更新有很多亮点。
与新的移动端教程新的性能检测工具演示相关的库TorchCSPRNG、TorchVision、TorchText和TorchText,用于优化代码并更新编译器Python中的函数转换以增强分布式训练需要注意的是,1.6以后,Pytorch的新功能分为Stable、Beta、Prototype三个版本。 其中,Prototype不属于稳定的发行版,必须从Nightly版本进行自我编译。
添加到
Python to Python函数转换
的beta特性torch.fx实现了从Python到Python的函数转换,可以轻松参与所有工作流。
版本
新的API,向NumPy学习!
1.7中添加的beta特性torch.fft为正式特性。 实现了与Numpy的np.fft同样的快速傅立叶变换,增加了硬件加速的支持和自动指导,更好地支持了科学计算。还增加了测试版NumPy样式的线性代数模块torch.linalg,支持Cholesky分解、行列式、特征值等功能。
增强分布式训练
增加稳定的异步错误和超时处理,提高NCCL的可靠性。 增加了beta版的流水线并行化功能***,可以将数据分解为更小的块,提高并行计算效率。
添加测试版的DDP通信挂钩以控制工作器之间的同步梯度。 此外,还有Prototype版分布式培训的新功能。
ZeroRedundancyOptimizer :用于减少所有参与进程的内存消耗。
进程组nccl send/recv :允许用户使用Python而不是c进行集合运算。
cuda-supportinrpcusingtensorpipe :提高n卡运算的效率。
远程模块:允许用户像处理本地模块一样操作远程模块。
移动端新教程
随着这次更新,发布了图像分割模型DeepLabV3的安卓和在IOS上的详细教程。安卓和IOS上的演示程序,如图像分割、目标检测、神经机器翻译等,方便大家更快地拿到。
另外,还有py torch mobilite解释器,可以减小运行时文件的大小。
添加
性能检测工具
测试版的Benchmark utils可以帮助用户进行准确的性能测试。并且Prototype版的FX图形模式量化实现了量化过程的自动化。
文章的部分素材来源:量子比特