Python对象的浅复制与深复制

发布于:2021-02-01 14:28:20

0

450

0

python 对象 浅复制 深复制

Python中的赋值语句不创建对象的副本,它们只将名称绑定到对象。对于不可变对象,这通常没有什么区别。

但是对于处理可变对象或可变对象的集合,您可能正在寻找一种方法来创建这些对象的“真实副本”或“克隆”。

本质上,您有时需要可以修改的副本,而无需同时自动修改原始副本。在本文中,我将向您简要介绍如何在python3中复制或“克隆”对象,以及其中涉及的一些注意事项。

注意:本教程是用Python3编写的,但在复制对象方面,Python2和Python3没有什么区别。如果有差异,我会在文中指出。

让我们先看看如何复制Python的内置集合。Python内置的可变集合(如list、dict和set)可以通过在现有集合上调用它们的工厂函数来复制:

new_list = list(original_list)
new_dict = dict(original_dict)
new_set = set(original_set)

但是,这种方法不适用于自定义对象,除此之外,它只创建浅复制。对于列表、dict和set等复合对象,浅复制和深复制有一个重要区别:

  • 浅复制意味着构造一个新的集合对象,然后用在原始集合中找到的子对象的引用填充它。从本质上说,浅复制只是一个层次的深复制。复制过程不会递归,因此不会创建子对象本身的副本。

  • 深度复制使复制过程递归。这意味着首先构造一个新的集合对象,然后用在原始集合中找到的子对象的副本递归地填充它。以这种方式复制对象会遍历整个对象树,以创建原始对象及其所有子对象的完全独立克隆。

我知道,那有点过分了。所以让我们看一些例子来说明深复制和浅复制之间的区别。

进行浅复制

在下面的示例中,我们将创建一个新的嵌套列表,然后使用list()工厂函数对其进行浅复制:

>>> xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> ys = list(xs)  # Make a shallow copy

这意味着ys现在将是一个新的独立对象,其内容与xs相同。您可以通过检查两个对象来验证这一点:

>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

要确认ys确实独立于原始对象,让我们设计一个小实验。您可以尝试将新的子列表添加到原始列表(xs),然后检查以确保此修改不会影响副本(ys):

>>> xs.append(['new sublist'])
>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9], ['new sublist']]
>>> ys
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

如您所见,这达到了预期的效果。在“浅表”级别修改复制的列表完全没有问题。

但是,由于我们只创建了原始列表的浅表副本,ys仍然包含对存储在xs中的原始子对象的引用这些子对象没有被复制。它们只是在复制的列表中再次引用。

因此,当您修改xs中的一个子对象时,这种修改也会反映在ys中,这是因为两个列表共享相同的子对象。副本只是一个浅的、一级的深副本:

>>> xs[1][0] = 'X'
>>> xs
[[1, 2, 3], ['X', 5, 6], [7, 8, 9], ['new sublist']]
>>> ys
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]

在上面的示例中,我们(似乎)只对xs进行了更改。但事实证明,在xsys中,索引1处的两个子列表都被修改了。再次发生这种情况是因为我们只创建了原始列表的浅副本。

如果我们在第一步中创建了xs的深副本,两个对象将完全独立。这就是对象的浅复制和深复制之间的实际区别。

现在您知道如何创建一些内置集合类的浅复制,并且知道了浅复制和深复制之间的区别。我们仍然需要回答的问题是:

  • 如何创建内置集合的深度副本?

  • 如何创建任意对象(包括自定义类)的副本(浅副本和深副本)?

这些问题的答案在Python标准库的copy模块中。此模块提供了一个简单的界面,用于创建任意Python对象的浅复制和深复制。

制作深度复制

让我们重复前面的列表复制示例,但有一个重要区别。这次我们将使用copy模块中定义的deepcopy()函数来创建深度副本:

>>> import copy
>>> xs = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> zs = copy.deepcopy(xs)

当您检查xs及其用copy.deepcopy()创建的克隆zs时,您将看到它们看起来又是一样的上一个示例:

>>> xs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
>>> zs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

但是,如果您对原始对象(xs)中的一个子对象进行修改,您将看到此修改不会影响深度副本(zs)。

这一次,原始对象和副本都是完全独立的。xs是递归克隆的,包括它的所有子对象:

>>> xs[1][0] = 'X'
>>> xs
[[1, 2, 3], ['X', 5, 6], [7, 8, 9]]
>>> zs
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

您现在可能需要花一些时间坐下来使用Python解释器并播放这些示例。当你开始亲身体验和体验这些例子时,你可以更轻松地将你的头脑围绕在复制对象上。

顺便说一句,你也可以使用copy模块中的函数创建浅复制。copy.copy()函数创建对象的浅复制。

如果您需要清楚地告知您正在代码中的某个地方创建浅复制,这将非常有用。使用copy.copy()可以指示此事实。但是,对于内置的集合,只需使用list、dict和set factory函数来创建浅层副本就被认为更具Pythonic了。

复制任意Python对象

我们仍然需要回答的问题是如何创建任意对象(包括自定义类)的副本(浅副本和深副本)。现在让我们来看看。

再一次,copy模块来拯救我们。它的copy.copy()copy.deepcopy()功能可用于复制任何对象。

再次强调,了解如何使用这些功能的最佳方法是通过简单的实验。我将以前面的列表复制示例为基础。让我们从定义一个简单的2D点类开始:

class Point:
   def __init__(self, x, y):
       self.x = x
       self.y = y

   def __repr__(self):
       return f'Point({self.x!r}, {self.y!r})'

我希望您同意这非常简单。我添加了一个__repr__()实现,这样我们就可以在Python解释器中轻松地检查从这个类创建的对象。

注意:上面的示例使用python3.6f-string来构造__repr__返回的字符串。在Python2和Python3.6之前的版本上,您将使用不同的字符串格式表达式,例如:

def __repr__(self):
   return 'Point(%r, %r)' % (self.x, self.y)

接下来,我们将创建一个Point实例,然后(粗略地)复制它,使用copy模块:

>>> a = Point(23, 42)
>>> b = copy.copy(a)

如果我们检查原始Point对象及其(浅层)克隆的内容,我们会看到预期的结果:

>>> a
Point(23, 42)
>>> b
Point(23, 42)
>>> a is b
False

这里还有一些需要记住的内容。因为我们的点对象使用不可变类型(int)作为其坐标,所以在这种情况下浅复制和深复制没有区别。但我马上就要展开这个例子了。

让我们转到一个更复杂的例子。我将定义另一个类来表示二维矩形。我将用一种方法来创建一个更复杂的对象层次结构我的矩形将使用Point对象来表示它们的坐标:

class Rectangle:
   def __init__(self, topleft, bottomright):
       self.topleft = topleft
       self.bottomright = bottomright

   def __repr__(self):
       return (f'Rectangle({self.topleft!r}, '
               f'{self.bottomright!r})')

再次,首先我们将尝试创建一个矩形实例的浅层副本:

rect = Rectangle(Point(0, 1), Point(5, 6))
srect = copy.copy(rect)

如果您检查原始矩形及其副本,您将看到__repr__()重写工作得多么顺利,浅复制过程也按预期工作:

>>> rect
Rectangle(Point(0, 1), Point(5, 6))
>>> srect
Rectangle(Point(0, 1), Point(5, 6))
>>> rect is srect
False

还记得前面的列表示例如何说明深复制和浅复制之间的区别吗?我要用同样的方法。我将在对象层次结构中更深层地修改一个对象,然后您将在(浅层)副本中看到这一更改:

>>> rect.topleft.x = 999
>>> rect
Rectangle(Point(999, 1), Point(5, 6))
>>> srect
Rectangle(Point(999, 1), Point(5, 6))

我希望这是您所期望的。接下来,我将创建原始矩形的深度副本。然后我将应用另一个修改,您将看到哪些对象受到影响:

>>> drect = copy.deepcopy(srect)
>>> drect.topleft.x = 222
>>> drect
Rectangle(Point(222, 1), Point(5, 6))
>>> rect
Rectangle(Point(999, 1), Point(5, 6))
>>> srect
Rectangle(Point(999, 1), Point(5, 6))

Voila!这一次,深复制(drect)完全独立于原始拷贝(rect)和浅复制(srect)。

我们在这里讨论了很多问题,复制对象还有一些更精细的地方。

深入是值得的(哈!)在本主题中,您可能需要学习copy模块文档。例如,对象可以通过在其上定义特殊方法__copy__()__deepcopy__()来控制它们的复制方式。

记住的3件事

  • 对对象进行浅层复制不会克隆子对象。因此,副本并非完全独立于原始对象。

  • 对象的深度副本将递归地克隆子对象。克隆完全独立于原始副本,但创建深度副本的速度较慢。

  • 您可以使用copy模块复制任意对象(包括自定义类)。