首页 > 编程知识 正文

h5文件能保存到本地么,h5实现文件下载

时间:2023-05-06 13:33:45 阅读:130054 作者:2493

H5文件是分层数据格式的第五代版本(HDF5 ),是用于存储科学数据的文件格式和库文件。 之所以接触这种文件格式,也是因为在上Coursera深度学习课时,作业被占用了。 这是由美国超级计算和APP应用中心开发的一种文件格式,用于存储和组织大型数据。 目前由非营利组织的HDF团队支持。

目前,许多业务和非业务组织都支持Java、MATLAB、Python和r等文件格式。

官网: https://www.hdfgroup.org/

H5文件在内存占用、压缩和访问速度方面非常出色,在工业和科学领域都有很多操作。

将H5文件结构简化为两种主要对象类型:

1、数据集是同一类型数据的多维数组。

2、组是可以包含数据集和其他组的容器结构。

因此,H5文件将成为真正分层结构的基于文件系统的数据类型。 实际上,HDF5文件中的资源是以类似POSIX的语法访问的。 元数据由用户定义,并作为命名属性附加到组和数据集。 可以使用数据集、组和属性构建更复杂的存储格式,如图像和表。

除了文件格式的先进性外,HDF5还包括表示数据空间选择的改进类型的系统和数据空间对象。 API也是关于数据集、组、属性、类型等的面向对象的形式。

由于使用B-tree对表对象进行索引,因此H5非常适合股价序列、网络监测序列数据、3D气象数据等时间序列数据。 (中国国家卫星气象中心发布文件HDF5.0的使用配置文件也应该使用这种数据格式。)

H5自身是通过c程序提供库函数提供外部访问的接口。 Python主要使用h5py模块操作相关格式。 要读取的函数如下:

def load _ data (: train _ dataset=h5py.file (datasets/train _ catvnoncat.H5 ), ' r ' (train_set_x _ orig=NP.array (train _ dataset ) (train _ set _ x ' ) : ) ) ) )是' ] [ : ] # yourtraiin test _ catvnoncat.H5 ', ' r ' ) test _ set _ x _ orig=NP.array (test _ dataset [ ' test _ set _ x ' ] [ : ] ) yourtestsetfeaturestest [ (yourtestsetlabelsclasses=NP.array ) test_dataset('list_classes ' ) : () ) ) ) 652 theray train _ set _ y _ orig.shape (0test _ set _ y _ orig.shape [0] ) (return train_set_x_orig,train _ set

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。