获取对象信息

    当我们拿到一个对象的引用时,如何知道这个对象是什么类型、有哪些方法呢?

    使用type()

    首先,我们来判断对象类型,使用 type() 函数:

    基本类型都可以用 type() 判断:

    >>> type(123)

    <type 'int'>

    >>> type('str')

    <type 'str'>

    >>> type(None)

    <type 'NoneType'>

    如果一个变量指向函数或者类,也可以用 type() 判断:

    >>> type(abs)

    <type 'builtinfunctionor_method'>

    >>> type(a)

    <class '__main
    .Animal'>

    但是 type() 函数返回的是什么类型呢?它返回type类型。如果我们要在 if 语句中判断,就需要比较两个变量的type类型是否相同:

    >>> type(123)==type(456)

    True

    >>> type('abc')==type('123')

    True

    >>> type('abc')==type(123)

    False

    但是这种写法太麻烦,Python把每种type类型都定义好了常量,放在 types 模块里,使用之前,需要先导入:

    >>> import types

    >>> type('abc')==types.StringType

    True

    >>> type(u'abc')==types.UnicodeType

    True

    >>> type([])==types.ListType

    True

    >>> type(str)==types.TypeType

    True

    最后注意到有一种类型就叫 TypeType ,所有类型本身的类型就是 TypeType ,比如:

    >>> type(int)==type(str)==types.TypeType

    True

    使用isinstance()

    对于class的继承关系来说,使用type()就很不方便。我们要判断class的类型,可以使用 isinstance() 函数。

    我们回顾上次的例子,如果继承关系是:

    object -> Animal -> Dog -> Husky

    那么, isinstance() 就可以告诉我们,一个对象是否是某种类型。先创建3种类型的对象:

    >>> a = Animal()

    >>> d = Dog()

    >>> h = Husky()

    然后,判断:

    >>> isinstance(h, Husky)

    True

    没有问题,因为 h 变量指向的就是Husky对象。

    再判断:

    >>> isinstance(h, Dog)

    True

    h 虽然自身是Husky类型,但由于Husky是从Dog继承下来的,所以, h 也还是Dog类型。换句话说, isinstance() 判断的是一个对象是否是该类型本身,或者位于该类型的父继承链上。

    因此,我们可以确信, h 还是Animal类型:

    >>> isinstance(h, Animal)

    True

    同理,实际类型是Dog的 d 也是Animal类型:

    >>> isinstance(d, Dog) and isinstance(d, Animal)

    True

    但是, d 不是Husky类型:

    >>> isinstance(d, Husky)

    False

    能用 type() 判断的基本类型也可以用 isinstance() 判断:

    >>> isinstance('a', str)

    True

    >>> isinstance(u'a', unicode)

    True

    >>> isinstance('a', unicode)

    False

    并且还可以判断一个变量是否是某些类型中的一种,比如下面的代码就可以判断是否是str或者unicode:

    >>> isinstance('a', (str, unicode))

    True

    >>> isinstance(u'a', (str, unicode))

    True

    由于 str unicode 都是从 basestring 继承下来的,所以,还可以把上面的代码简化为:

    >>> isinstance(u'a', basestring)

    True

    使用dir()

    如果要获得一个对象的所有属性和方法,可以使用 dir() 函数,它返回一个包含字符串的list,比如,获得一个str对象的所有属性和方法:

    >>> dir('ABC')

    ['add', 'class', 'contains', 'delattr', 'doc', 'eq', 'format', 'ge', 'getattribute', 'getitem', 'getnewargs', 'getslice', 'gt', 'hash', 'init', 'le', 'len', 'lt', 'mod', 'mul', 'ne', 'new', 'reduce', 'reduce_ex', 'repr', 'rmod', 'rmul', 'setattr', 'sizeof', 'str', 'subclasshook', 'formatterfield_name_split', 'formatterparser', 'capitalize', 'center', 'count', 'decode', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'index', 'isalnum', 'isalpha', 'isdigit', 'islower', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']

    类似 xxx 的属性和方法在Python中都是有特殊用途的,比如 len 方法返回长度。在Python中,如果你调用 len() 函数试图获取一个对象的长度,实际上,在 len() 函数内部,它自动去调用该对象的 len() 方法,所以,下面的代码是等价的:

    >>> len('ABC')

    3

    >>> 'ABC'.len()

    3

    我们自己写的类,如果也想用 len(myObj) 的话,就自己写一个 len() 方法:

    >>> class MyObject(object):

    … def len(self):

    … return 100



    >>> obj = MyObject()

    >>> len(obj)

    100

    剩下的都是普通属性或方法,比如 lower() 返回小写的字符串:

    >>> 'ABC'.lower()

    'abc'

    仅仅把属性和方法列出来是不够的,配合 getattr() setattr() 以及 hasattr() ,我们可以直接操作一个对象的状态:

    >>> class MyObject(object):

    … def init(self):

    … self.x = 9

    … def power(self):

    … return self.x * self.x



    >>> obj = MyObject()

    紧接着,可以测试该对象的属性:

    >>> hasattr(obj, 'x') # 有属性'x'吗?

    True

    >>> obj.x

    9

    >>> hasattr(obj, 'y') # 有属性'y'吗?

    False

    >>> setattr(obj, 'y', 19) # 设置一个属性'y'

    >>> hasattr(obj, 'y') # 有属性'y'吗?

    True

    >>> getattr(obj, 'y') # 获取属性'y'

    19

    >>> obj.y # 获取属性'y'

    19

    如果试图获取不存在的属性,会抛出AttributeError的错误:

    >>> getattr(obj, 'z') # 获取属性'z'

    Traceback (most recent call last):

    File "<stdin>", line 1, in <module>

    AttributeError: 'MyObject' object has no attribute 'z'

    可以传入一个default参数,如果属性不存在,就返回默认值:

    >>> getattr(obj, 'z', 404) # 获取属性'z',如果不存在,返回默认值404

    404

    也可以获得对象的方法:

    >>> hasattr(obj, 'power') # 有属性'power'吗?

    True

    >>> getattr(obj, 'power') # 获取属性'power'

    <bound method MyObject.power of <main.MyObject object at 0x108ca35d0>>

    >>> fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn

    >>> fn # fn指向obj.power

    <bound method MyObject.power of <main.MyObject object at 0x108ca35d0>>

    >>> fn() # 调用fn()与调用obj.power()是一样的

    81

    小结

    通过内置的一系列函数,我们可以对任意一个Python对象进行剖析,拿到其内部的数据。要注意的是,只有在不知道对象信息的时候,我们才会去获取对象信息。如果可以直接写:

    sum = obj.x + obj.y

    就不要写:

    sum = getattr(obj, 'x') + getattr(obj, 'y')

    一个正确的用法的例子如下:

    def readImage(fp):

    if hasattr(fp, 'read'):

    return readData(fp)

    return None

    假设我们希望从文件流fp中读取图像,我们首先要判断该fp对象是否存在read方法,如果存在,则该对象是一个流,如果不存在,则无法读取。 hasattr() 就派上了用场。

    请注意,在Python这类动态语言中,有 read() 方法,不代表该fp对象就是一个文件流,它也可能是网络流,也可能是内存中的一个字节流,但只要 read() 方法返回的是有效的图像数据,就不影响读取图像的功能。