- Python大数据分析算法与实例
- 邓立国
- 562字
- 2022-07-27 19:35:03
3.4 数据类型
1.NumPy数据类型
NumPy支持比Python更多种类的数据类型。表3.1定义了不同标量的数据类型。
表3.1 不同标量的数据类型
NumPy数值类型是dtype(数据类型)对象的实例,每个对象具有唯一的特征。这些类型可以是np.bool_、np.float32等。
2.数据类型对象(dtype)
数据类型对象描述了对应于数组的固定内存块的解释,取决于以下5个方面:
- 数据类型(整数、浮点数或者Python对象)。
- 数据大小。
- 字节序(小端或大端)。
- 在结构化类型的情况下,字段的名称、每个字段的数据类型和每个字段占用的内存块部分。
- 数据类型是子序列的形状和数据类型。
字节顺序取决于数据类型的前缀“<”或“>”。<意味着编码是小端(最小有效字节存储在最小地址中),>意味着编码是大端(最大有效字节存储在最小地址中)。
dtype可由以下语法构造:
numpy.dtype(object, align, copy)
参数说明如下:
- object:被转换为数据类型的对象。
- align:如果为true,就向字段添加间隔,使其类似C的结构体。
- copy:生成dtype对象的新副本,如果为false,结果就是内建数据类型对象的引用。
【例3.5】
# 使用数组标量类型 import numpy as np dt = np.dtype(np.int32) print dt
输出如下:
int32
【例3.6】
# 首先创建结构化数据类型 import numpy as np dt = np.dtype([('age',np.int8)]) print dt
输出如下:
[('age', 'i1')]
【例3.7】
# 现在将其应用于 ndarray 对象 import numpy as np dt = np.dtype([('age',np.int8)]) a = np.array([(10,),(20,),(30,)], dtype = dt) print a
输出如下:
[(10,) (20,) (30,)]
每个内建类型都有一个唯一定义它的字符代码:
- 'b':布尔值。
- 'i':符号整数。
- 'u':无符号整数。
- 'f':浮点数。
- 'c':复数浮点数。
- 'm':时间间隔。
- 'M':日期时间。
- 'O':Python对象。
- 'S', 'a':字节串。
- 'U':Unicode。
- 'V':原始数据(void)。