了解__get__和__set__以及Python描述符


310

试图了解什么是Python的描述符以及它们的用途。我了解它们的工作原理,但这是我的疑问。考虑以下代码:

class Celsius(object):
    def __init__(self, value=0.0):
        self.value = float(value)
    def __get__(self, instance, owner):
        return self.value
    def __set__(self, instance, value):
        self.value = float(value)


class Temperature(object):
    celsius = Celsius()
  1. 为什么需要描述符类?

  2. 什么是instanceowner这里?(在中__get__)。这些参数的目的是什么?

  3. 我将如何调用/使用此示例?

Answers:


147

描述符是如何实现Python property类型的。描述符仅实现__get____set__等等,然后被添加到其定义中的另一个类中(就像上面对Temperature类所做的那样)。例如:

temp=Temperature()
temp.celsius #calls celsius.__get__

访问您为描述符分配的属性(celsius在上面的示例中)调用适当的描述符方法。

instancein __get__是类的实例(因此,上面__get__将接收tempowner而是带有描述符的类(因此将是Temperature)。

您需要使用描述符类来封装为其提供动力的逻辑。这样,如果描述符用于缓存某些昂贵的操作(例如),它可以将值存储在自身而不是其类上。

关于描述符的文章可以在这里找到。

编辑:正如jchl在评论中指出的,如果您只是尝试Temperature.celsiusinstance将是None


6
self和之间有什么区别instance
Lemma Prism,

2
'instance'可以是任何类的实例,self是相同类的实例。
TheBeginner '19

3
@LemmaPrism self是描述符实例,instance是描述符在(instance.__class__ is owner)中的类的实例(如果已实例化)。
Tcll

Temperature.celsius0.0根据代码给出值celsius = Celsius()。调用描述符Celsius,因此其实例具有0.0分配给Temperature类属性celsius 的初始值。
Angel Salazar

109

为什么需要描述符类?

它使您可以更好地控制属性的工作方式。例如,如果您习惯于使用Java中的getter和setter,那么这就是Python的方法。优点之一是,它对用户的外观就像一个属性(语法没有变化)。因此,您可以从一个普通属性开始,然后在需要做一些花哨的事情时,切换到一个描述符。

属性只是可变值。描述符使您可以在读取或设置(或删除)值时执行任意代码。因此,您可以想象使用它将属性映射到数据库中的字段,例如–一种ORM。

另一个用法可能是通过抛出异常来拒绝接受新值,__set__从而有效地使“属性” 变为只读。

什么是instanceowner这里?(在中__get__)。这些参数的目的是什么?

这是相当微妙的(这也是我在这里写一个新答案的原因-我在想这个问题的同时发现了这个问题,却没有发现现有的答案那么好)。

描述符是在类上定义的,但通常是从实例中调用的。当同时从实例instance和实例都调用它时owner(并且可以从中进行计算ownerinstance因此似乎没有意义)。但是,当从类中调用时,仅owner会设置-这就是它在那里的原因。

这仅是需要的,__get__因为它是唯一可以在类上调用的类。如果设置类值,则设置描述符本身。对于删除同样如此。这就是为什么owner不需要那里的原因。

我将如何调用/使用此示例?

好吧,这是一个使用类似类的绝妙技巧:

class Celsius:

    def __get__(self, instance, owner):
        return 5 * (instance.fahrenheit - 32) / 9

    def __set__(self, instance, value):
        instance.fahrenheit = 32 + 9 * value / 5


class Temperature:

    celsius = Celsius()

    def __init__(self, initial_f):
        self.fahrenheit = initial_f


t = Temperature(212)
print(t.celsius)
t.celsius = 0
print(t.fahrenheit)

(我使用的是Python 3;对于python 2,您需要确保这些除法是/ 5.0/ 9.0)。这给出了:

100.0
32.0

现在还有其他可以说是更好的方法可以在python中实现相同的效果(例如,如果celsius是一个属性,这是相同的基本机制,但是将所有源都放在Temperature类中),但这显示了可以完成的工作...


2
转换是错误的:它们应为C = 5(F-32)/ 9,F = 32 + 9C / 5。
musiphil

1
确保您有一个温度对象。进行后续操作会使事情变得混乱。t1 =温度(190)打印t1.celsius t1.celsius = 100打印t1.fahrenheit现在,当您检查t.celcius和t.fahrenheit时,它们也会被修改。摄氏温度是115,华氏温度是32。这显然是错误的。@Eric
Ishan Bhatt

1
@IshanBhatt:我认为是由于上述musiphil指出的错误。另外,这不是我的答案
埃里克

68

我试图了解什么是Python的描述符以及它们可用于什么。

描述符是具有以下任何特殊方法的类属性(如属性或方法):

  • __get__ (非数据描述符方法,例如方法/函数)
  • __set__ (数据描述符方法,例如在属性实例上)
  • __delete__ (数据描述符方法)

这些描述符对象可用作其他对象类定义的属性。(也就是说,它们位于__dict__类对象的中。)

描述符对象可用于以编程方式管理foo.descriptor正则表达式,赋值甚至删除中的点分查找(例如)的结果。

函数/方法,绑定方法,propertyclassmethodstaticmethod所有使用这些特殊的方法来控制它们是如何通过点查找访问。

像这样的数据描述符property可以根据对象的简单状态对属性进行延迟评估,与实例中预先计算每个可能的属性相比,允许实例使用更少的内存。

member_descriptor创建的另一个数据描述符a __slots__通过允许类将数据存储在可变的类似元组的数据结构中而不是更灵活但占用空间的方法来节省内存__dict__

非数据描述符(通常是实例,类和静态方法)从其非数据描述符方法中获取其隐式第一个参数(通常分别命名为clsself__get__

大多数Python用户只需要学习简单的用法,而无需进一步学习或理解描述符的实现。

深入:什么是描述符?

描述符是具有以下任何一种方法(__get____set____delete__)的对象,旨在通过点分查找来使用,就好像它是实例的典型属性一样。对于obj_instance具有一个descriptor对象的所有者对象,:

  • obj_instance.descriptor调用
    descriptor.__get__(self, obj_instance, owner_class)返回a。value
    这就是所有方法和geton属性的工作方式。

  • obj_instance.descriptor = value调用
    descriptor.__set__(self, obj_instance, value)返回None
    这就是setteron属性的工作方式。

  • del obj_instance.descriptor调用
    descriptor.__delete__(self, obj_instance)返回None
    这就是deleteron属性的工作方式。

obj_instance是实例,其类包含描述符对象的实例。self描述符的实例(可能只是的类的一个obj_instance

要使用代码定义此对象,如果对象的属性集与任何必需的属性相交,则该对象为描述符:

def has_descriptor_attrs(obj):
    return set(['__get__', '__set__', '__delete__']).intersection(dir(obj))

def is_descriptor(obj):
    """obj can be instance of descriptor or the descriptor class"""
    return bool(has_descriptor_attrs(obj))

数据描述符具有一个__set__和/或__delete__
一个非数据描述既没有__set__也没有__delete__

def has_data_descriptor_attrs(obj):
    return set(['__set__', '__delete__']) & set(dir(obj))

def is_data_descriptor(obj):
    return bool(has_data_descriptor_attrs(obj))

内置描述符对象示例:

  • classmethod
  • staticmethod
  • property
  • 一般功能

非数据描述符

我们可以看到,classmethodstaticmethod在非数据描述符:

>>> is_descriptor(classmethod), is_data_descriptor(classmethod)
(True, False)
>>> is_descriptor(staticmethod), is_data_descriptor(staticmethod)
(True, False)

两者都只有__get__方法:

>>> has_descriptor_attrs(classmethod), has_descriptor_attrs(staticmethod)
(set(['__get__']), set(['__get__']))

请注意,所有函数也是非数据描述符:

>>> def foo(): pass
... 
>>> is_descriptor(foo), is_data_descriptor(foo)
(True, False)

数据描述符 property

但是,property是一个数据描述符:

>>> is_data_descriptor(property)
True
>>> has_descriptor_attrs(property)
set(['__set__', '__get__', '__delete__'])

点分查找顺序

这些是重要的区别,因为它们会影响点分查找的查找顺序。

obj_instance.attribute
  1. 首先,上面的代码看一下该属性是否是实例类上的Data-Descriptor,
  2. 如果不是,它将查看该属性是否在obj_instance的中__dict__,然后
  3. 最后,它归结为非数据描述符。

此查找顺序的结果是实例可以覆盖诸如函数/方法之类的非数据描述符。

回顾与下一步

我们已经了解到,描述与任何对象__get____set____delete__。这些描述符对象可用作其他对象类定义的属性。现在,以您的代码为例,看看它们的用法。


从问题中分析代码

这是您的代码,然后是每个问题和答案:

class Celsius(object):
    def __init__(self, value=0.0):
        self.value = float(value)
    def __get__(self, instance, owner):
        return self.value
    def __set__(self, instance, value):
        self.value = float(value)

class Temperature(object):
    celsius = Celsius()
  1. 为什么需要描述符类?

您的描述符可确保您始终为的此类属性具有浮点数Temperature,并且不能用于del删除该属性:

>>> t1 = Temperature()
>>> del t1.celsius
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: __delete__

否则,描述符将忽略所有者类和所有者实例,而是将状态存储在描述符中。您可以使用一个简单的class属性轻松地在所有实例之间共享状态(只要您始终将其设置为该类的float且从不删除它,或者让您的代码用户满意):

class Temperature(object):
    celsius = 0.0

这样可以使您获得与示例完全相同的行为(请参见下面对问题3的回答),但是使用Python内置(property),并且会被认为更惯用:

class Temperature(object):
    _celsius = 0.0
    @property
    def celsius(self):
        return type(self)._celsius
    @celsius.setter
    def celsius(self, value):
        type(self)._celsius = float(value)
  1. 什么是实例和所有者?(获得)。这些参数的目的是什么?

instance是调用描述符的所有者的实例。所有者是使用描述符对象管理对数据点的访问的类。有关更多描述性变量名,请参见此答案第一段旁边的定义描述符的特殊方法的描述。

  1. 我将如何调用/使用此示例?

这是一个示范:

>>> t1 = Temperature()
>>> t1.celsius
0.0
>>> t1.celsius = 1
>>> 
>>> t1.celsius
1.0
>>> t2 = Temperature()
>>> t2.celsius
1.0

您无法删除该属性:

>>> del t2.celsius
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: __delete__

而且您不能分配不能转换为浮点数的变量:

>>> t1.celsius = '0x02'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 7, in __set__
ValueError: invalid literal for float(): 0x02

否则,您这里拥有的是所有实例的全局状态,可以通过分配给任何实例来进行管理。

最有经验的Python程序员完成此结果的预期方式是使用property装饰器,该装饰器在幕后使用相同的描述符,但将行为带入了owner类的实现(同样,如上所定义):

class Temperature(object):
    _celsius = 0.0
    @property
    def celsius(self):
        return type(self)._celsius
    @celsius.setter
    def celsius(self, value):
        type(self)._celsius = float(value)

具有与原始代码完全相同的预期行为:

>>> t1 = Temperature()
>>> t2 = Temperature()
>>> t1.celsius
0.0
>>> t1.celsius = 1.0
>>> t2.celsius
1.0
>>> del t1.celsius
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
AttributeError: can't delete attribute
>>> t1.celsius = '0x02'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 8, in celsius
ValueError: invalid literal for float(): 0x02

结论

我们已经介绍了定义描述符的属性,数据描述符和非数据描述符之间的区别,使用它们的内置对象以及有关使用的特定问题。

同样,您将如何使用问题的示例?我希望你不会。我希望您从我的第一个建议(一个简单的类属性)开始,如果有必要,请继续进行第二个建议(属性装饰器)。


1
很好,我从这个答案中学到了很多(当然也从别人那里学到了)。有关此语句的问题“大多数经验丰富的Python程序员完成此结果的预期方式……”。您在语句之前和之后定义的Temeperature类是相同的。我想念你在这里得到什么吗?
Yolo Voe '18

1
@YoloVoe不,是的,我添加了一些括号括弧,以强调这是上面的重复。
亚伦·霍尔

1
这是一个惊人的答案。我需要再读几遍,但是我觉得我对Python的理解仅仅提高了几个等级
Lucas Young

20

在详细介绍描述符之前,了解Python中的属性查找如何工作可能很重要。这假定该类没有元类,并且使用的默认实现__getattribute__(均可用于“自定义”行为)。

在这种情况下,属性查找(在Python 3.x中或在Python 2.x中用于新样式类)的最佳说明来自于了解Python元类(ionel的代码日志)。该图像:代替“不可自定义的属性查找”。

这代表一个属性的查找foobarinstanceClass

在此处输入图片说明

这里有两个条件很重要:

  • 如果的类instance具有属性名称的条目,并且具有__get____set__
  • 如果instance已经没有了属性名称条目,但类有一个和它有__get__

这就是描述符的所在:

  • 具有__get__和的数据描述符__set__
  • 仅具有的非数据描述符__get__

在这两种情况下,返回的值都__get__以实例作为第一个参数,而类作为第二个参数进行调用。

对于类属性查找,查找甚至更加复杂(例如,请参见类属性查找(在上述博客中))。

让我们转到您的具体问题:

为什么需要描述符类?

在大多数情况下,您不需要编写描述符类!但是,您可能是非常普通的最终用户。例如功能。函数是描述符,这就是将函数用作self隐式传递为第一个参数的方法的方式。

def test_function(self):
    return self

class TestClass(object):
    def test_method(self):
        ...

如果您查找test_method实例,您将获得“绑定方法”:

>>> instance = TestClass()
>>> instance.test_method
<bound method TestClass.test_method of <__main__.TestClass object at ...>>

同样,您也可以通过__get__手动调用函数的方法来绑定函数(不建议这样做,仅出于说明目的):

>>> test_function.__get__(instance, TestClass)
<bound method test_function of <__main__.TestClass object at ...>>

您甚至可以将此方法称为“自绑定方法”:

>>> test_function.__get__(instance, TestClass)()
<__main__.TestClass at ...>

请注意,我没有提供任何参数,该函数确实返回了绑定的实例!

函数是非数据描述符

数据描述符的一些内置示例为property。忽略gettersetterdeleterproperty描述符是(来自描述符方法指南“属性”):

class Property(object):
    def __init__(self, fget=None, fset=None, fdel=None, doc=None):
        self.fget = fget
        self.fset = fset
        self.fdel = fdel
        if doc is None and fget is not None:
            doc = fget.__doc__
        self.__doc__ = doc

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        if self.fget is None:
            raise AttributeError("unreadable attribute")
        return self.fget(obj)

    def __set__(self, obj, value):
        if self.fset is None:
            raise AttributeError("can't set attribute")
        self.fset(obj, value)

    def __delete__(self, obj):
        if self.fdel is None:
            raise AttributeError("can't delete attribute")
        self.fdel(obj)

因为它是一个数据描述符它的调用,只要你抬头看的“名字” property,它只是委托给装饰的功能@property@name.setter以及@name.deleter(如果存在的话)。

还有一些其他的描述符在标准库中,例如staticmethodclassmethod

描述符的要点很容易(尽管您很少需要它们):用于属性访问的抽象通用代码。property是实例变量访问function的抽象,staticmethod提供方法的抽象,为不需要实例访问classmethod的方法提供抽象,为需要类访问而不是实例访问的方法提供抽象(这有点简化)。

另一个示例是class属性

一个有趣的示例(__set_name__从Python 3.6 使用)也可以是仅允许特定类型的属性:

class TypedProperty(object):
    __slots__ = ('_name', '_type')
    def __init__(self, typ):
        self._type = typ

    def __get__(self, instance, klass=None):
        if instance is None:
            return self
        return instance.__dict__[self._name]

    def __set__(self, instance, value):
        if not isinstance(value, self._type):
            raise TypeError(f"Expected class {self._type}, got {type(value)}")
        instance.__dict__[self._name] = value

    def __delete__(self, instance):
        del instance.__dict__[self._name]

    def __set_name__(self, klass, name):
        self._name = name

然后,您可以在类中使用描述符:

class Test(object):
    int_prop = TypedProperty(int)

并玩一点:

>>> t = Test()
>>> t.int_prop = 10
>>> t.int_prop
10

>>> t.int_prop = 20.0
TypeError: Expected class <class 'int'>, got <class 'float'>

或“懒惰的财产”:

class LazyProperty(object):
    __slots__ = ('_fget', '_name')
    def __init__(self, fget):
        self._fget = fget

    def __get__(self, instance, klass=None):
        if instance is None:
            return self
        try:
            return instance.__dict__[self._name]
        except KeyError:
            value = self._fget(instance)
            instance.__dict__[self._name] = value
            return value

    def __set_name__(self, klass, name):
        self._name = name

class Test(object):
    @LazyProperty
    def lazy(self):
        print('calculating')
        return 10

>>> t = Test()
>>> t.lazy
calculating
10
>>> t.lazy
10

在这些情况下,将逻辑移到公共描述符中可能很有意义,但是也可以使用其他方法解决它们(但可能需要重复一些代码)。

什么是instanceowner这里?(在中__get__)。这些参数的目的是什么?

这取决于您如何查找属性。如果您在实例上查找属性,则:

  • 第二个参数是您在其中查找属性的实例
  • 第三个参数是实例的类

如果您在类上查找属性(假设描述符是在类上定义的):

  • 第二个参数是 None
  • 第三个参数是您在其中查找属性的类

因此,基本上,如果要在执行类级查找时自定义行为(因为instanceis None),则第三个参数是必需的。

我将如何调用/使用此示例?

您的示例基本上是一个属性,该属性仅允许将值转换为该值,float并且该值可以在该类的所有实例之间共享(并且可以在该类上共享-尽管只能在该类上使用“读取”访问权限,否则您将替换描述符实例):

>>> t1 = Temperature()
>>> t2 = Temperature()

>>> t1.celsius = 20   # setting it on one instance
>>> t2.celsius        # looking it up on another instance
20.0

>>> Temperature.celsius  # looking it up on the class
20.0

这就是为什么描述符通常使用第二个参数(instance)存储值以避免共享它的原因。但是在某些情况下,可能需要在实例之间共享一个值(尽管目前我无法想到一种情况)。但是,对于温度等级的摄氏温度特性几乎没有任何意义……除了纯粹作为学术练习之外。


不知道是否应将图形的透明背景确实在暗模式下遭受影响,是否应作为错误报告给stackoverflow。
Tshirtman,

@Tshirtman我认为这是图像本身的问题。它不是完全透明的...我从博客中获取了它,并且不知道如何在适当的透明背景下重新创建它。太糟糕了,它在深色背景下看起来很奇怪:(
MSeifert

9

为什么需要描述符类?

由Buciano Ramalho的Fluent Python启发

想象你有一个这样的班级

class LineItem:
     price = 10.9
     weight = 2.1
     def __init__(self, name, price, weight):
          self.name = name
          self.price = price
          self.weight = weight

item = LineItem("apple", 2.9, 2.1)
item.price = -0.9  # it's price is negative, you need to refund to your customer even you delivered the apple :(
item.weight = -0.8 # negative weight, it doesn't make sense

我们应该验证权重和价格,以避免给它们分配负数,如果我们使用描述符作为代理,则可以编写更少的代码,因为

class Quantity(object):
    __index = 0

    def __init__(self):
        self.__index = self.__class__.__index
        self._storage_name = "quantity#{}".format(self.__index)
        self.__class__.__index += 1

    def __set__(self, instance, value):
        if value > 0:
            setattr(instance, self._storage_name, value)
        else:
           raise ValueError('value should >0')

   def __get__(self, instance, owner):
        return getattr(instance, self._storage_name)

然后像这样定义类LineItem:

class LineItem(object):
     weight = Quantity()
     price = Quantity()

     def __init__(self, name, weight, price):
         self.name = name
         self.weight = weight
         self.price = price

我们可以扩展Quantity类以进行更常见的验证


1
有趣的用例,因为它显示了如何使用描述符与多个用户实例进行交互。我最初不了解要点:必须在类名称空间中创建带有描述符的属性(例如weight = Quantity(),但必须仅使用self(例如self.weight = 4)在实例名称空间中设置值,否则该属性将反弹到新值!!
分钟

我无法理解一件事。您正在定义weight = Quantity()为类变量及其类,__get__并且__set__正在处理实例变量。怎么样?
技术专家

0

我尝试(根据建议进行了一些小的更改)安德鲁·库克答案中的代码。(我正在运行python 2.7)。

编码:

#!/usr/bin/env python
class Celsius:
    def __get__(self, instance, owner): return 9 * (instance.fahrenheit + 32) / 5.0
    def __set__(self, instance, value): instance.fahrenheit = 32 + 5 * value / 9.0

class Temperature:
    def __init__(self, initial_f): self.fahrenheit = initial_f
    celsius = Celsius()

if __name__ == "__main__":

    t = Temperature(212)
    print(t.celsius)
    t.celsius = 0
    print(t.fahrenheit)

结果:

C:\Users\gkuhn\Desktop>python test2.py
<__main__.Celsius instance at 0x02E95A80>
212

对于3之前的Python,请确保您从对象继承了子类,这将使描述符正确工作,因为get魔术不适用于旧样式类。


1
描述符仅适用于新样式类。对于Python 2.x的这种手段从“对象”,这是默认的Python 3派生类
伊沃·范德Wijk

0

您会看到https://docs.python.org/3/howto/descriptor.html#properties

class Property(object):
    "Emulate PyProperty_Type() in Objects/descrobject.c"

    def __init__(self, fget=None, fset=None, fdel=None, doc=None):
        self.fget = fget
        self.fset = fset
        self.fdel = fdel
        if doc is None and fget is not None:
            doc = fget.__doc__
        self.__doc__ = doc

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        if self.fget is None:
            raise AttributeError("unreadable attribute")
        return self.fget(obj)

    def __set__(self, obj, value):
        if self.fset is None:
            raise AttributeError("can't set attribute")
        self.fset(obj, value)

    def __delete__(self, obj):
        if self.fdel is None:
            raise AttributeError("can't delete attribute")
        self.fdel(obj)

    def getter(self, fget):
        return type(self)(fget, self.fset, self.fdel, self.__doc__)

    def setter(self, fset):
        return type(self)(self.fget, fset, self.fdel, self.__doc__)

    def deleter(self, fdel):
        return type(self)(self.fget, self.fset, fdel, self.__doc__)

1
这不会回答问题或提供任何有用的信息。
塞巴斯蒂安·尼尔森
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.