Изменяеми срещу неизменяеми обекти в Python - визуално и практически ръководство

Python е страхотен език. Поради простотата му, много хора го избират като първия си език за програмиране.

Опитните програмисти също използват Python през цялото време, благодарение на неговата широка общност, изобилие от пакети и ясен синтаксис.

Но има един проблем, който изглежда обърква начинаещите, както и някои опитни разработчици: обекти на Python. По-точно, разликата между изменяеми и неизменяеми обекти.

В тази публикация ще задълбочим познанията си за обекти на Python, ще научим разликата между изменяеми и неизменяеми обекти и ще видим как можем да използваме интерпретатора, за да разберем по-добре как работи Python.

Ще използваме важни функции и ключови думи като idи isи ще разберем разликата между x == yи x is y.

Готови ли сте за това? Да започваме.

В Python всичко е обект

За разлика от други езици за програмиране, където езикът поддържа обекти, в Python наистина всичко е обект - включително цели числа, списъци и дори функции.

Можем да използваме нашия преводач, за да потвърдим, че:

>>> isinstance(1, object) True >>> isinstance(False, object) True def my_func(): return "hello" >>> isinstance(my_func, object) True

Python има вградена функция, idкоято връща адреса на обект в паметта. Например:

>>> x = 1 >>> id(x) 1470416816

По-горе създадохме обект с името на xи му присвоихме стойността на 1. След това използвахме id(x)и открихме, че този обект се намира на адреса 1470416816в паметта.

Това ни позволява да проверяваме интересни неща за Python. Да приемем, че създаваме две променливи в Python - едната с името на x, а другата с името на y- и им присвояваме една и съща стойност. Например тук:

>>> x = "I love Python!" >>> y = "I love Python!"

Можем да използваме оператора за равенство ( ==), за да проверим дали те наистина имат еднаква стойност в очите на Python:

>>> x == y True

Но това ли е един и същ обект в паметта? На теория тук може да има два много различни сценария.

Според сценарий (1) наистина имаме два различни обекта, един с името на x, и друг с името на y, които просто имат еднаква стойност.

И все пак може да се случи, че Python всъщност съхранява тук само един обект, който има две имена, които го препращат - както е показано в сценарий (2) :

Можем да използваме idвъведената по-горе функция, за да проверим това:

>>> x = "I love Python!" >>> y = "I love Python!" >>> x == y True >>> id(x) 52889984 >>> id(y) 52889384

Както виждаме, поведението на Python съвпада със сценарий (1), описан по-горе. Въпреки че x == yв този пример (т.е. xи yимат еднакви стойности ), те са различни обекти в паметта. Това е така id(x) != id(y), както можем да проверим изрично:

>>> id(x) == id(y) False

Има по-кратък начин за сравнение по-горе, а именно използването на isоператора на Python . Проверката дали x is yе същото като проверката id(x) == id(y), което означава дали xи yса един и същ обект в паметта:

>>> x == y True >>> id(x) == id(y) False >>> x is y False

Това хвърля светлина върху важната разлика между оператора за равенство и оператора ==за идентичност is.

Както можете да видите в горния пример, напълно е възможно две имена в Python ( xи y) да бъдат обвързани с два различни обекта (и по този начин x is yе False), където тези два обекта имат еднаква стойност (така x == yе True).

Как можем да създадем друга променлива, която сочи към същия обект, към който xсочи? Можем просто да използваме оператора за присвояване =по следния начин:

>>> x = "I love Python!" >>> z = x

За да проверим дали те наистина сочат към един и същ обект, можем да използваме isоператора:

>>> x is z True

Разбира се, това означава, че те имат един и същ адрес в паметта, тъй като можем да проверим изрично, като използваме id:

>>> id(x) 54221824 >>> id(z) 54221824

И, разбира се, те имат една и съща стойност, така че очакваме x == zда се върнем Trueи:

>>> x == z True

Изменяеми и неизменяеми обекти в Python

Казахме, че всичко в Python е обект, но има важно разграничение между обектите. Някои обекти са променливи, докато други са неизменяеми .

Както споменах преди, този факт създава объркване за много хора, които са нови за Python, така че ще се уверим, че е ясно.

Неизменяеми обекти в Python

За някои типове в Python, след като сме създали екземпляри от тези типове, те никога не се променят. Те са неизменни .

Например intобектите са неизменяеми в Python. Какво ще се случи, ако се опитаме да променим стойността на intобект?

>>> x = 24601 >>> x 24601 >>> x = 24602 >>> x 24602

Well, it seems that we changed x successfully. This is exactly where many people get confused. What exactly happened under the hood here? Let's use id to further investigate:

>>> x = 24601 >>> x 24601 >>> id(x) 1470416816 >>> x = 24602 >>> x 24602 >>> id(x) 1470416832

So we can see that by assigning x = 24602, we didn't change the value of the object that x had been bound to before. Rather, we created a new object, and bound the name x to it.

So after assigning 24601 to x by using x = 24601, we had the following state:

And after using x = 24602, we created a new object, and bound the name x to this new object. The other object with the value of 24601 is no longer reachable by x (or any other name in this case):

Whenever we assign a new value to a name (in the above example - x) that is bound to an int object, we actually change the binding of that name to another object.

The same applies for tuples, strings (str objects), and bools as well. In other words, int (and other number types such as float), tuple, bool, and str objects are immutable.

Let's test this hypothesis. What happens if we create a tuple object, and then give it a different value?

>>> my_tuple = (1, 2, 3) >>> id(my_tuple) 54263304 >>> my_tuple = (3, 4, 5) >>> id(my_tuple) 56898184

Just like an int object, we can see that our assignment actually changed the object that the name my_tuple is bound to.

What happens if we try to change one of the tuple's elements?

>>> my_tuple[0] = 'a new value' Traceback (most recent call last): File "", line 1, in  TypeError: 'tuple' object does not support item assignment

As we can see, Python doesn't allow us to modify my_tuple's contents, as it is immutable.

Mutable objects in Python

Some types in Python can be modified after creation, and they are called mutable. For example, we know that we can modify the contents of a list object:

>>> my_list = [1, 2, 3] >>> my_list[0] = 'a new value' >>> my_list ['a new value', 2, 3]

Does that mean we actually created a new object when assigning a new value to the first element of my_list? Again, we can use id to check:

>>> my_list = [1, 2, 3] >>> id(my_list) 55834760 >>> my_list [1, 2, 3] >>> my_list[0] = 'a new value' >>> id(my_list) 55834760 >>> my_list ['a new value', 2, 3]

So our first assignment my_list = [1, 2, 3] created an object in the address 55834760, with the values of 1, 2, and 3:

We then modified the first element of this list object using my_list[0] = 'a new value', that is - without creating a new list object:

Now, let us create two names – x and y, both bound to the same list object. We can verify that either by using is, or by explicitly checking their ids:

>>> x = y = [1, 2] >>> x is y True >>> id(x) 18349096 >>> id(y) 18349096 >>> id(x) == id(y) True

What happens now if we use x.append(3)? That is, if we add a new element (3) to the object by the name of x?

Will x by changed? Will y?

Well, as we already know, they are basically two names of the same object:

Since this object is changed, when we check its names we can see the new value:

>>> x.append(3) >>> x [1, 2, 3] >>> y [1, 2, 3]

Note that x and y have the same id as before – as they are still bound to the same list object:

>>> id(x) 18349096 >>> id(y) 18349096

In addition to lists, other Python types that are mutable include sets and dicts.

Implications for dictionary keys in Python

Dictionaries (dict objects) are commonly used in Python. As a quick reminder, we define them like so:

my_dict = {"name": "Omer", "number_of_pets": 1}

We can then access a specific element by its key name:

>>> my_dict["name"] 'Omer'

Dictionaries are mutable, so we can change their content after creation. At any given moment, a key in the dictionary can point to one element only:

>>> my_dict["name"] = "John" >>> my_dict["name"] 'John'

It is interesting to note that a dictionary's keys must be immutable:

>>> my_dict = {[1,2]: "Hello"} Traceback (most recent call last): File "", line 1, in  TypeError: unhashable type: 'list'

Why is that so?

Let's consider the following hypothetical scenario (note: the snippet below can't really be run in Python):

>>> x = [1, 2] >>> y = [1, 2, 3] >>> my_dict = {x: 'a', y: 'b'}

So far, things don't seem that bad. We'd assume that if we access my_dict with the key of [1, 2], we will get the corresponding value of 'a', and if we access the key [1, 2, 3], we will get the value 'b'.

Now, what would happen if we attempted to use:

>>> x.append(3)

In this case, x would have the value of [1, 2, 3], and y would also have the value of [1, 2, 3]. What should we get when we ask for my_dict[[1, 2, 3]]? Will it be 'a' or 'b'? To avoid such cases, Python simply doesn't allow dictionary keys to be mutable.

Taking things a bit further

Let's try to apply our knowledge to a case that is a bit more interesting.

Below, we define a list (a mutable object) and a tuple (an immutable object). The list includes a tuple, and the tuple includes a list:

>>> my_list = [(1, 1), 2, 3] >>> my_tuple = ([1, 1], 2, 3) >>> type(my_list)  >>> type(my_list[0])  >>> type(my_tuple)  >>> type(my_tuple[0]) 

So far so good. Now, try to think for yourself – what will happen when we try to execute each of the following statements?

(1) >>> my_list[0][0] = 'Changed!'

(2) >>> my_tuple[0][0] = 'Changed!'

In statement (1), what we are trying to do is change my_list's first element, that is, a tuple. Since a tuple is immutable, this attempt is destined to fail:

>>> my_list[0][0] = 'Changed!' Traceback (most recent call last): File "", line 1, in  TypeError: 'tuple' object does not support item assignment

Note that what we were trying to do is not change the list, but rather – change the contents of its first element.

Let's consider statement (2). In this case, we are accessing my_tuple's first element, which happens to be a list, and modify it. Let's further investigate this case and look at the addresses of these elements:

>>> my_tuple = ([1, 1], 2, 3) >>> id(my_tuple) 20551816 >>> type(my_tuple[0])  >>> id(my_tuple[0]) 20446248

When we change my_tuple[0][0], we do not really change my_tuple at all! Indeed, after the change, my_tuple's first element will still be the object whose address in memory is 20446248. We do, however, change the value of that object:

>>> my_tuple[0][0] = 'Changed!' >>> id(my_tuple) 20551816 >>> id(my_tuple[0]) 20446248 >>> my_tuple (['Changed!', 1], 2, 3)

Since we only modified the value of my_tuple[0], which is a mutable list object, this operation was indeed allowed by Python.

Recap

In this post we learned about Python objects. We said that in Python everything is an object, and got to use id and is to deepen our understanding of what's happening under the hood when using Python to create and modify objects.

We also learned the difference between mutable objects, that can be modified after creation, and immutable objects, which cannot.

We saw that when we ask Python to modify an immutable object that is bound to a certain name, we actually create a new object and bind that name to it.

We then learned why dictionary keys have to be immutable in Python.

Understanding how Python "sees" objects is a key to becoming a better Python programmer. I hope this post has helped you on your journey to mastering Python.

Omer Rosenbaum, Swimm’s Chief Technology Officer. Cyber training expert and Founder of Checkpoint Security Academy. Author of Computer Networks (in Hebrew). Visit My YouTube Channel.