python standard library array type

每日一词: underdog

英 [ˈʌndədɒg] 美 [ˈʌndərdɔg]

n.失败者; 退居下风的人; 受压迫者; 打败了的选手

复数: underdogs

这个词来自1887年出现,原指在斗狗比赛中战败的狗。后来词义引申至人,指的是各类竞赛和对碰中不被看好的一方,或是指处在逆境中的人和团体。

被看好的一方,即Topdog,从来不缺喝彩和支持。而Underdog的路则注定孤独许多。不被人看好,较少人支持。

所幸的是,正如倪匡先生感言:太多的时候,孤独最好。

若能与孤独为师,又何须担心underdog呢?

python 标准库学习 array

此模块定义了一种对象类型,可以紧凑地表示基本类型值的数组:字符、整数、浮点数等。 数组属于序列类型,其行为与列表非常相似,不同之处在于其中存储的对象类型是受限的。 类型在对象创建时使用单个字符的 类型码 来指定。 已定义的类型码如下:

类型码 C 类型 Python 类型 以字节表示的最小尺寸 注释
'b' signed char int 1
'B' unsigned char int 1
'u' Py_UNICODE Unicode 字符 2 (1)
'h' signed short int 2
'H' unsigned short int 2
'i' signed int int 2
'I' 无符号整型 int 2
'l' signed long int 4
'L' 无符号长整型 int 4
'q' signed long long int 8
'Q' 无符号 long long int 8
'f' float float 4
'd' double float 8

==注释==

‘u’类型码在python3已经被废除,默认python的字符串就是unicode字符

  • class array.array(typecode[, initializer])

    一个包含由 typecode 限制类型的条目的新数组,并由可选的 initializer 值进行初始化,该值必须为一个列表、bytes-like object 或包含正确类型元素的可迭代对象。如果给定一个列表或字符串,该 initializer 会被传给新数组的 fromlist(), frombytes()fromunicode() 方法(见下文)以将初始条目添加到数组中。 否则会将可迭代对象作为 initializer 传给 extend() 方法。引发一个 审核事件 array.__new__ 附带参数 typecode, initializer

属性

  • array.typecodes

    包含所有可用类型码的字符串。

1
2
3
>>> import array
>>> array.typecodes
'bBuhHiIlLqQfd'

数组对象支持普通的序列操作如索引、切片、拼接和重复等。 当使用切片赋值时,所赋的值必须为具有相同类型码的数组对象;所有其他情况都将引发 TypeError。 数组对象也实现了缓冲区接口,可以用于所有支持 字节类对象 的场合。

函数

以下数据项和方法也受到支持:

  • array.typecode

    用于创建数组的类型码字符。

  • array.itemsize

    在内部表示中一个数组项的字节长度。

  • array.append(x)

    添加一个值为 x 的新项到数组末尾。

  • array.buffer_info()

    返回一个元组 (address, length) 以给出用于存放数组内容的缓冲区元素的当前内存地址和长度。 以字节表示的内存缓冲区大小可通过 array.buffer_info()[1] * array.itemsize 来计算。 这在使用需要内存地址的低层级(因此不够安全) I/O 接口时会很有用,例如某些 ioctl() 操作。 只要数组存在并且没有应用改变长度的操作,返回数值就是有效的。注解 当在 C 或 C++ 编写的代码中使用数组对象时(这是有效使用此类信息的唯一方式),使用数组对象所支持的缓冲区接口更为适宜。 此方法仅保留用作向下兼容,应避免在新代码中使用。 缓冲区接口的文档参见 缓冲协议

  • array.byteswap()

    “字节对调”所有数组项。 此方法只支持大小为 1, 2, 4 或 8 字节的值;对于其他值类型将引发 RuntimeError。 它适用于从不同字节序机器所生成的文件中读取数据的情况。

  • array.count(x)

    返回 x 在数组中的出现次数。

  • array.extend(iterable)

    将来自 iterable 的项添加到数组末尾。 如果 iterable 是另一个数组,它必须具有 完全 相同的类型码;否则将引发 TypeError。 如果 iterable 不是一个数组,则它必须为可迭代对象并且其元素必须为可添加到数组的适当类型。

  • array.frombytes(s)

    添加来自字符串的项,将字符串解读为机器值的数组(相当于使用 fromfile() 方法从文件中读取数据)。3.2 新版功能: fromstring() 重命名为 frombytes() 以使其含义更清晰。

  • array.fromfile(f, n)

    file object f 中读取 n 项(解读为机器值)并将它们添加到数组末尾。 如果可读取数据少于 n 项则将引发 EOFError,但有效的项仍然会被插入数组。 f 必须为一个真实的内置文件对象;不支持带有 read() 方法的其它对象。

  • array.fromlist(list)

    添加来自 list 的项。 这等价于 for x in list: a.append(x),区别在于如果发生类型错误,数组将不会被改变。

  • array.fromstring()

    frombytes() 的已弃用别名。Deprecated since version 3.2, will be removed in version 3.9.

  • array.fromunicode(s)

    使用来自给定 Unicode 字符串的数组扩展数组。 数组必须是类型为 'u' 的数组;否则将引发 ValueError。 请使用 array.frombytes(unicodestring.encode(enc)) 来将 Unicode 数据添加到其他类型的数组。

  • array.index(x)

    返回最小的 i 使得 ix 在数组中首次出现的序号。

  • array.insert(i, x)

    将值 x 作为新项插入数组的 i 位置之前。 负值将被视为相对于数组末尾的位置。

  • array.pop([i])

    从数组中移除序号为 i 的项并将其返回。 可选参数值默认为 -1,因此默认将移除并返回末尾项。

  • array.remove(x)

    从数组中移除首次出现的 x

  • array.reverse()

    反转数组中各项的顺序。

  • array.tobytes()

    将数组转换为一个机器值数组并返回其字节表示(即相当与通过 tofile() 方法写入到文件的字节序列。)3.2 新版功能: tostring() 被重命名为 tobytes() 以使其含义更清晰。

  • array.tofile(f)

    将所有项(作为机器值)写入到 file object f

  • array.tolist()

    将数组转换为包含相同项的普通列表。

  • array.tostring()

    tobytes() 的已弃用别名。Deprecated since version 3.2, will be removed in version 3.9.

  • array.tounicode()

    将数组转换为一个 Unicode 字符串。 数组必须是类型为 'u' 的数组;否则将引发 ValueError。 请使用 array.tobytes().decode(enc) 来从其他类型的数组生成 Unicode 字符串。

当一个数组对象被打印或转换为字符串时,它会表示为 array(typecode, initializer)。 如果数组为空则 initializer 会被省略,否则如果 typecode'u' 则它是一个字符串,否则它是一个数字列表。 使用 eval() 保证能将字符串转换回具有相同类型和值的数组,只要 array 类已通过 from array import array 被引入。 例如:

1
2
3
4
5
from array import array
array('l')
array('u', 'hello \u2641')
array('l', [1, 2, 3, 4, 5])
array('d', [1.0, 2.0, 3.14])

更高效数组处理的可以详见 numpy

总结

原来python标准库里就有专门操作array对象的方法,这里我理解array和list的区别在于,list里包含的元素可以是任意数据类型,处理数据的时候不是很方便,而array里的数据类型是一致的,这样处理数据效率更高。

坚持原创技术分享,您的支持将鼓励我继续创作!
0%