NPZ 文件是 NumPy 中用于存储多个数组的压缩文件格式。它是 .npz
文件扩展名的缩写,通常用于存储多个 .npy
格式的数组文件。这种文件格式在数据科学和机器学习中非常常见,尤其是在处理大量数据时,因为它可以将多个 NumPy 数组打包在一个文件中,同时压缩文件以节省存储空间。
要打开和读取 .npz
文件,我们可以使用 NumPy 提供的 numpy.load
函数。numpy.load
函数不仅可以加载单一的 .npy
文件,也能处理 .npz
文件。
首先,确保你的环境中安装了 NumPy 库。如果没有安装,可以通过以下命令安装:
bash
pip install numpy
然后,导入 NumPy 库:
python
import numpy as np
可以使用 numpy.load
函数打开 NPZ 文件。加载后,它会返回一个类似字典的对象,包含文件中的所有数组。你可以通过文件中的键访问这些数组。
```python
data = np.load('data_file.npz')
print(data.files) ```
data.files
会返回一个包含所有数组键的列表,这些键对应 NPZ 文件中存储的每个数组。
一旦加载了 NPZ 文件,就可以通过键来访问数组。例如,如果你想获取名为 arr_0
的数组:
python
array_0 = data['arr_0']
print(array_0)
尽管 numpy.load
返回的对象类似于字典,但它实际上是一个支持上下文管理器的对象。如果你不再需要访问数据,最好显式地关闭文件:
python
data.close()
以下是一个完整的示例,展示了如何打开一个 NPZ 文件并访问其中的数组:
```python import numpy as np
data = np.load('data_file.npz')
print("文件中包含的数组键:", data.files)
array_0 = data['arr_0'] print("数组 'arr_0' 的内容:") print(array_0)
data.close() ```
.npz
文件是一个压缩文件格式,通常用于存储多个 NumPy 数组。numpy.load
可以加载 .npz
文件,并通过文件中的键访问数组。通过这种方式,您可以方便地管理和处理多个数组的数据。