python standard library array type

每日一词: underdog

英 [ˈʌndədɒg] 美 [ˈʌndərdɔg]

n.失败者；退居下风的人；受压迫者；打败了的选手

复数： underdogs

这个词来自1887年出现，原指在斗狗比赛中战败的狗。后来词义引申至人，指的是各类竞赛和对碰中不被看好的一方，或是指处在逆境中的人和团体。

被看好的一方，即Topdog，从来不缺喝彩和支持。而Underdog的路则注定孤独许多。不被人看好，较少人支持。

所幸的是，正如倪匡先生感言：太多的时候，孤独最好。

若能与孤独为师,又何须担心underdog呢？

python 标准库学习 array

此模块定义了一种对象类型，可以紧凑地表示基本类型值的数组：字符、整数、浮点数等。数组属于序列类型，其行为与列表非常相似，不同之处在于其中存储的对象类型是受限的。类型在对象创建时使用单个字符的 类型码 来指定。已定义的类型码如下：

类型码	C 类型	Python 类型	以字节表示的最小尺寸	注释
`'b'`	signed char	int	1
`'B'`	unsigned char	int	1
`'u'`	Py_UNICODE	Unicode 字符	2	(1)
`'h'`	signed short	int	2
`'H'`	unsigned short	int	2
`'i'`	signed int	int	2
`'I'`	无符号整型	int	2
`'l'`	signed long	int	4
`'L'`	无符号长整型	int	4
`'q'`	signed long long	int	8
`'Q'`	无符号 long long	int	8
`'f'`	float	float	4
`'d'`	double	float	8

==注释==

‘u’类型码在python3已经被废除,默认python的字符串就是unicode字符

类

class array.array(typecode[, initializer])

一个包含由 typecode 限制类型的条目的新数组，并由可选的 initializer 值进行初始化，该值必须为一个列表、bytes-like object 或包含正确类型元素的可迭代对象。如果给定一个列表或字符串，该 initializer 会被传给新数组的 fromlist(), frombytes() 或 fromunicode() 方法（见下文）以将初始条目添加到数组中。否则会将可迭代对象作为 initializer 传给 extend() 方法。引发一个审核事件 array.__new__ 附带参数 typecode, initializer。

属性

array.typecodes

包含所有可用类型码的字符串。

1
2
3

>>> import array
>>> array.typecodes
'bBuhHiIlLqQfd'

数组对象支持普通的序列操作如索引、切片、拼接和重复等。当使用切片赋值时，所赋的值必须为具有相同类型码的数组对象；所有其他情况都将引发 TypeError。数组对象也实现了缓冲区接口，可以用于所有支持字节类对象的场合。

函数

以下数据项和方法也受到支持：

array.typecode

用于创建数组的类型码字符。
array.itemsize

在内部表示中一个数组项的字节长度。
array.append(x)

添加一个值为 x 的新项到数组末尾。
array.buffer_info()

返回一个元组 (address, length) 以给出用于存放数组内容的缓冲区元素的当前内存地址和长度。以字节表示的内存缓冲区大小可通过 array.buffer_info()[1] * array.itemsize 来计算。这在使用需要内存地址的低层级（因此不够安全） I/O 接口时会很有用，例如某些 ioctl() 操作。只要数组存在并且没有应用改变长度的操作，返回数值就是有效的。注解当在 C 或 C++ 编写的代码中使用数组对象时（这是有效使用此类信息的唯一方式），使用数组对象所支持的缓冲区接口更为适宜。此方法仅保留用作向下兼容，应避免在新代码中使用。缓冲区接口的文档参见缓冲协议。
array.byteswap()

“字节对调”所有数组项。此方法只支持大小为 1, 2, 4 或 8 字节的值；对于其他值类型将引发 RuntimeError。它适用于从不同字节序机器所生成的文件中读取数据的情况。
array.count(x)

返回 x 在数组中的出现次数。
array.extend(iterable)

将来自 iterable 的项添加到数组末尾。如果 iterable 是另一个数组，它必须具有完全相同的类型码；否则将引发 TypeError。如果 iterable 不是一个数组，则它必须为可迭代对象并且其元素必须为可添加到数组的适当类型。
array.frombytes(s)

添加来自字符串的项，将字符串解读为机器值的数组（相当于使用 fromfile() 方法从文件中读取数据）。3.2 新版功能: fromstring() 重命名为 frombytes() 以使其含义更清晰。
array.fromfile(f, n)

从 file object f 中读取 n 项（解读为机器值）并将它们添加到数组末尾。如果可读取数据少于 n 项则将引发 EOFError，但有效的项仍然会被插入数组。 f 必须为一个真实的内置文件对象；不支持带有 read() 方法的其它对象。
array.fromlist(list)

添加来自 list 的项。这等价于 for x in list: a.append(x)，区别在于如果发生类型错误，数组将不会被改变。
array.fromstring()

frombytes() 的已弃用别名。Deprecated since version 3.2, will be removed in version 3.9.
array.fromunicode(s)

使用来自给定 Unicode 字符串的数组扩展数组。数组必须是类型为 'u' 的数组；否则将引发 ValueError。请使用 array.frombytes(unicodestring.encode(enc)) 来将 Unicode 数据添加到其他类型的数组。
array.index(x)

返回最小的 i 使得 i 为 x 在数组中首次出现的序号。
array.insert(i, x)

将值 x 作为新项插入数组的 i 位置之前。负值将被视为相对于数组末尾的位置。
array.pop([i])

从数组中移除序号为 i 的项并将其返回。可选参数值默认为 -1，因此默认将移除并返回末尾项。
array.remove(x)

从数组中移除首次出现的 x。
array.reverse()

反转数组中各项的顺序。
array.tobytes()

将数组转换为一个机器值数组并返回其字节表示（即相当与通过 tofile() 方法写入到文件的字节序列。）3.2 新版功能: tostring() 被重命名为 tobytes() 以使其含义更清晰。
array.tofile(f)

将所有项（作为机器值）写入到 file object f。
array.tolist()

将数组转换为包含相同项的普通列表。
array.tostring()

tobytes() 的已弃用别名。Deprecated since version 3.2, will be removed in version 3.9.
array.tounicode()

将数组转换为一个 Unicode 字符串。数组必须是类型为 'u' 的数组；否则将引发 ValueError。请使用 array.tobytes().decode(enc) 来从其他类型的数组生成 Unicode 字符串。

当一个数组对象被打印或转换为字符串时，它会表示为 array(typecode, initializer)。如果数组为空则 initializer 会被省略，否则如果 typecode 为 'u' 则它是一个字符串，否则它是一个数字列表。使用 eval() 保证能将字符串转换回具有相同类型和值的数组，只要 array 类已通过 from array import array 被引入。例如:

from array import array
array('l')
array('u', 'hello \u2641')
array('l', [1, 2, 3, 4, 5])
array('d', [1.0, 2.0, 3.14])

更高效数组处理的可以详见 numpy 库

总结

原来python标准库里就有专门操作array对象的方法,这里我理解array和list的区别在于,list里包含的元素可以是任意数据类型,处理数据的时候不是很方便,而array里的数据类型是一致的,这样处理数据效率更高。