Множества (set)

Множество – это неупорядоченный набор элементов. Каждый элемент уникален (не имеет дубликатов) и должен быть неизменным (его нельзя изменить). Но само множество можно изменять: добавлять или удалять элементы из него.

Множество создается размещением с помощью функции set(). При этом элементы экранируются фигурными скобками и разделяются запятыми.

Множество может содержать любое количество элементов. Они могут быть различных типов. Но множество не может содержать изменяемый элемент, такой как список или словарь.

# множество целых чисел
my_set = {1, 2, 3}
print(my_set)

# множество значений разных типов
my_set = {1.0, "Hello", (1, 2, 3)}
print(my_set)

Другие примеры:

# множество не содержит дубликатов
# Вывод: {1, 2, 3, 4}
my_set = {1,2,3,4,3,2}
print(my_set)

# множество не может содержать изменяемых значений
# здесь [3, 4] - это изменяемый список
# Если вы раскомментируете строку #12,
# это приведет к ошибке.
# TypeError: unhashable type: 'list'

#my_set = {1, 2, [3, 4]}

# мы можем создать множество из этого списка
# Вывод: {1, 2, 3}
my_set = set([1,2,3,2])
print(my_set)

Создать пустое множество сложнее. Пустые фигурные скобки {} создадут пустой словарь Python. Чтобы создать множество без элементов, нужно вызвать функцию set() без аргументов.

# инициализируем a с помощью {}
a = {}

# проверяем тип данных a
# Вывод: <class 'dict'>
print(type(a))

# инициализируем a с помощью set()
a = set()

# проверяем тип данных a
# Вывод: <class 'set'>
print(type(a))

Как изменять множества в Python

Множества могут быть изменены. Но элементы в них неупорядоченные, поэтому индексирование не имеет смысла.

Нельзя получить доступ или изменить элемент множества, используя для этого индексацию или срез. Множество их не поддерживает.

Можно добавить один элемент, используя метод add(), несколько – используя метод update(). Он может принимать в качестве аргумента кортежи, списки, строки или другие множества. Во всех случаях дубликаты невозможны.

# инициализируем my_set
my_set = {1,3}
print(my_set)

# если вы раскомментируете строку 9,
# то получите ошибку
# TypeError: 'set' object does not support indexing

#my_set[0]

# добавление элемента
# Вывод: {1, 2, 3}
my_set.add(2)
print(my_set)

# добавление нескольких элементов
# Вывод: {1, 2, 3, 4}
my_set.update([2,3,4])
print(my_set)

# добавление списка и множества
# Вывод: {1, 2, 3, 4, 5, 6, 8}
my_set.update([4,5], {1,6,8})
print(my_set)

Результат работы программы:

{1, 3}
{1, 2, 3}
{1, 2, 3, 4}
{1, 2, 3, 4, 5, 6, 8}

Как удалить элементы из множества?

Это можно сделать с помощью методов discard() и remove(). Различие между ними состоит в том, что при использовании discard(), если элемент не существует во множестве, оно остается неизменным. А метод remove() выдаст ошибку.

Следующий пример иллюстрирует это.

# инициализируем my_set
my_set = {1, 3, 4, 5, 6}
print(my_set)

# удаляем элемент
# Вывод: {1, 3, 5, 6}
my_set.discard(4)
print(my_set)

# удаляем элемент
# Вывод: {1, 3, 5}
my_set.remove(6)
print(my_set)

# удаляем элемент,
# который отсутствует в my_set
# Вывод: {1, 3, 5}
my_set.discard(2)
print(my_set)

# удаляем элемент,
# который отсутствует в my_set
# Если вы раскомментируете строку 27,
# то получите ошибку.
# Вывод: KeyError: 2

#my_set.remove(2) 

Точно так же можно удалить и вернуть элемент, используя метод pop(). Но нет способа определить, какой элемент будет извлечен.

Мы также можем удалить все элементы из множества, используя метод clear().

# инициализируем my_set
# Вывод: множество уникальных элементов
my_set = set("HelloWorld")
print(my_set)

# извлекаем элемент
# Вывод: случайный элемент
print(my_set.pop())

# извлекаем еще один элемент
# Вывод: случайный элемент
my_set.pop()
print(my_set)

# очищаем my_set
#Вывод: set()
my_set.clear()
print(my_set)

Операции с множествами Python

Множества могут использоваться для выполнения математических операций: объединение, пересечение и симметричная разница.

Рассмотрим следующие два множества:

>>> A = {1, 2, 3, 4, 5}
>>> B = {4, 5, 6, 7, 8}

Объединение множеств

Объединение A и B – это множество всех элементов из обоих множеств.

Объединение  осуществляется с помощью оператора |. Эту же операцию можно осуществить с помощью метода union().

# инициализируем A и B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# используем оператор |
# Вывод: {1, 2, 3, 4, 5, 6, 7, 8}
print(A | B)

Протестируйте следующие примеры:

# используем функцию union
>>> A.union(B)
{1, 2, 3, 4, 5, 6, 7, 8}

# используем функцию union для B
>>> B.union(A)
{1, 2, 3, 4, 5, 6, 7, 8}

Пересечение множеств

Пересечение A и B – операция получения набора элементов, которые являются общими для обоих множеств.

Пересечение осуществляется с помощью оператора &. Эту же операцию можно произвести с помощью метода intersection().

# инициализируем A и B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# используем оператор &
# Вывод: {4, 5}
print(A & B) 

Протестируйте следующие примеры:

# используем функцию intersection для A
>>> A.intersection(B)
{4, 5}

# используем функцию intersection для B
>>> B.intersection(A)
{4, 5}

Определение разницы множеств

Разница A и B (A – B) – операция получения множества элементов, которые принадлежат только  A, но не принадлежат B. Точно так же,  B – A представляет собой множество элементов принадлежащих B , но не принадлежащих А.

Разница определяется с помощью оператора -. или метода difference().

# инициализируем A и B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# используем оператор - для A
# Вывод: {1, 2, 3}
print(A - B)

Протестируйте следующие примеры:

# используем функцию difference для A
>>> A.difference(B)
{1, 2, 3}

# используем оператор - для B
>>> B - A
{8, 6, 7}

# используем функцию difference для B
>>> B.difference(A)
{8, 6, 7}

Симметричная разница множеств

Симметричная разница A и B – это множество элементов в A и B, за исключением тех, которые являются общими для обоих множеств. Она определяется с помощью оператора ^ или метода symmetric_difference().

# инициализируем A и B
A = {1, 2, 3, 4, 5}
B = {4, 5, 6, 7, 8}

# используем оператор ^
# Вывод: {1, 2, 3, 6, 7, 8}
print(A ^ B)

Протестируйте следующие примеры:

# используем функцию symmetric_difference для A
>>> A.symmetric_difference(B)
{1, 2, 3, 6, 7, 8}

# используем функцию symmetric_difference для B
>>> B.symmetric_difference(A)
{1, 2, 3, 6, 7, 8}

Методы для работы с множествами в Python

Список всех методов, которые доступны для работы с объектами множеств.

Методы множеств Python
МетодОписание
add()Добавляет элемент во множество.
clear()Удаляет все элементы из множества.
copy()Возвращает копию множества.
difference()Возвращает разницу двух или более множеств в качестве нового множества.
difference_update()Удаляет все элементы другого множества из заданного множества.
discard()Удаляет элемент из множества, если он содержится в нем.
intersection()Возвращает пересечение двух множеств в качестве нового множества.
intersection_update()Обновляет множество пересечением с другим множеством.
isdisjoint()Возвращает значение True,   если два множества имеют нулевое пересечение.
issubset()Возвращает значение  True,  если другое множество содержит это множество.
issuperset()Возвращает значение True,  если это множество содержит другое множество.
pop()Удаляет и возвращает произвольный элемент множество. Выдает KeyError,  если множество пусто.
remove()Удаляет элемент из набора. Если элемент не является членом множества, выдает KeyError.
symmetric_difference()Возвращает симметричную разницу двух множеств как новое множество.
symmetric_difference_update()Обновляет множество симметричной разницей между собой и другим множеством.
union()Возвращает объединение множеств в новом наборе.
update()Обновляет множество объединением с другим множеством.

Другие операции над множествами

Проверка принадлежности к множеству

Мы можем проверить, существует ли элемент во множестве, используя ключевое слово in.

# инициализируем my_set
my_set = set("apple")

# проверяем, присутствует ли 'a'
# Вывод: True
print('a' in my_set)

# проверяем, присутствует ли 'p' 
# Вывод: False
print('p' not in my_set)

Итерация множества

Используя цикл for, можно выполнить переборку каждого элемента во множестве.

>>> for letter in set("apple"):
...     print(letter)
...    
a
p
e
l

Встроенные функции с множествами

Встроенные функции, такие как all(), any(), enumerate(), len(), max(), min(), sorted(), sum() , используются с множеством для выполнения различных задач.

Встроенные функции для работы с множествами
ФункцияОписание
all()Возвращает значение True, если все элементы множества являются true (или если множество пусто).
any()Возвращает значение True, если какой-либо элемент множества является true. Если множество пусто, возвращает значение False.
enumerate()Возвращает пронумерованный объект. Содержит индекс и значение всех элементов множества в виде пары.
len()Возвращает длину (количество элементов) множества.
max()Возвращает наибольший элемент во множестве.
min()Возвращает наименьший элемент во множестве.
sorted()Возвращает новый отсортированный список, состоящий из элементов множества (не сортирует само множество).
sum()Возвращает сумму всех элементов множества.

Python Frozenset

Frozenset – это новый класс, который имеет характеристики множества. Но его элементы не могут быть изменены после назначения. В то время как кортежи представляют собой неизменяемые списки, Frozensets являются неизменяемыми множествами.

Frozenset может быть создан с помощью функции frozenset(). Этот тип данных поддерживает такие методы, как copy(), difference(), intersection(), isdisjoint(), issubset(), issuperset(), symmetric_difference() и union(). Но он не поддерживает методы добавления или удаления элементов.

# инициализируем A и B
A = frozenset([1, 2, 3, 4])
B = frozenset([3, 4, 5, 6]) 

Протестируйте эти примеры.

>>> A.isdisjoint(B)
False
>>> A.difference(B)
frozenset({1, 2})
>>> A | B
frozenset({1, 2, 3, 4, 5, 6})
>>> A.add(3)
...
AttributeError: 'frozenset' object has no attribute 'add'