Python集合应用:10+个集合操作的实用案例

文摘   2024-11-18 20:29   江苏  

集合(Set)在Python中是一个无序且不重复元素的序列,它非常适合用于数据去重和集合运算。今天,我们将通过10个实用案例,一步步探索集合的奥秘,让Python编程更加得心应手。

案例1:创建集合和基本操作

目标:理解集合的创建及添加、删除元素。

# 创建集合
my_set = {123}
print("初始集合:", my_set)

# 添加元素
my_set.add(4)
print("添加元素后:", my_set)

# 删除元素
my_set.remove(2)
print("删除元素后:", my_set)

输出

初始集合: {1, 2, 3}
添加元素后: {1, 2, 3, 4}
删除元素后: {1, 3, 4}

注意add()用于添加元素,remove()用于删除元素,若元素不存在会抛出异常。

案例2:集合的并集

目标:合并两个集合的所有元素。

set1 = {123}
set2 = {234}
union_set = set1.union(set2)
print("并集:", union_set)

输出

并集: {1, 2, 3, 4}

技巧:使用|也可以实现并集操作,如set1 | set2

案例3:交集

目标:找出两个集合共有的元素。

set1 = {1234}
set2 = {2345}
intersection = set1.intersection(set2)
print("交集:", intersection)

输出

交集: {2, 3, 4}

小贴士&是交集的快捷符号,例如set1 & set2

案例4:差集

目标:找出在一个集合中但不在另一个集合中的元素。

set1 = {1234}
set2 = {3456}
difference = set1.difference(set2)
print("差集:", difference)

输出

差集: {1, 2}

使用提示:也可以用-操作符来表示差集,如set1 - set2

案例5:对称差集

目标:找出两个集合里独有的元素,即非交集部分。

set1 = {1234}
set2 = {3456}
symmetric_difference = set1.symmetric_difference(set2)
print("对称差集:", symmetric_difference)

输出

对称差集: {1, 2, 5, 6}

快捷方式^符号可以用来快速计算对称差集,如set1 ^ set2

案例6:集合的子集和超集

目标:判断一个集合是否是另一个集合的子集或超集。

subset = {12}
superset = {1234}
print("subset是superset的子集吗?", subset.issubset(superset))
print("superset是subset的超集吗?", superset.issuperset(subset))

输出

subset是superset的子集吗? True
superset是subset的超集吗? True

案例7:集合推导式

目标:利用集合推导式快速生成集合。

squares = {x**2 for x in range(16)}
print("平方数集合:", squares)

输出

平方数集合: {1, 4, 9, 16, 25}

解释:集合推导式是一种简洁的创建集合的方式,类似于列表推导式。

案例8:集合与字符串

目标:将字符串转换为字符集合,用于去重。

my_string = "hello"
unique_chars = set(my_string)
print("去重后的字符集合:", unique_chars)

输出

去重后的字符集合: {'o''l''e''h'}

应用场景:常用于统计文本中不重复字符的数量。

案例9:集合与迭代

目标:遍历集合并执行操作。

numbers = {123}
for num in numbers:
    print(num ** 2)

输出

1
4
9

提示:集合不适合需要顺序访问的场合,因为它们是无序的。

案例10:实际场景应用:数据清洗

目标:使用集合去除重复数据。

假设我们有两个列表,分别代表数据库的两次查询结果,我们需要合并这些结果并去除重复项。

query_result_1 = [101102103]
query_result_2 = [103104105]

# 使用集合合并并去重
unique_results = set(query_result_1 + query_result_2)
print("去重后的结果:", unique_results)

输出

去重后的结果: {101, 102, 103, 104, 105}

实践技巧:集合操作在数据清洗和预处理中非常有用,特别是当需要快速去除重复项时。


进阶应用:Python集合的高级技巧与实战案例

高级技巧1:集合的 frozenset

目标:了解不可变集合frozenset,及其在需要不可变数据结构的场景下的应用。

# 创建一个frozenset
frozen_set = frozenset([123])
try:
    frozen_set.add(4)  # 尝试添加元素
except AttributeError as e:
    print(e)

输出

'frozenset' object has no attribute 'add'

重要性frozenset可用于作为字典的键或集合的元素,因为它不可变且哈希。

高级技巧2:集合的异或操作

目标:理解异或操作^在集合中的应用,用于找出两个集合中独有的元素,不包括两者共有的元素。

set_a = {1234}
set_b = {3456}
unique_elements = set_a ^ set_b
print(unique_elements)

输出

{1, 2, 5, 6}

应用:在数据对比时非常有用,找出两边不同的数据。

实战案例:用户权限管理

场景描述:假设你正在开发一个系统,需要管理不同用户的不同权限集合。每个用户拥有一个权限集合,需要检查用户是否拥有特定权限,以及批量分配或移除权限。

# 用户权限初始化
user_permissions = {
    'Alice': {'read''write'},
    'Bob': {'read'},
    'Charlie': {'read''write''execute'}
}

def check_permission(user, permission):
    """检查用户是否有特定权限"""
    return permission in user_permissions.get(user, set())

def update_permissions(user, *permissions, add=True):
    """添加或移除权限"""
    current_perms = user_permissions.get(user, set())
    if add:
        user_permissions[user] = current_perms.union(permissions)
    else:
        user_permissions[user] = current_perms.difference(permissions)

# 检查权限
print(check_permission('Alice''write'))  # 输出: True

# 更新权限
update_permissions('Bob''write')
print(user_permissions['Bob'])  # 输出: {'read', 'write'}

# 移除权限
update_permissions('Bob''read', add=False)
print(user_permissions['Bob'])  # 输出: {'write'}

分析


  • 使用集合存储权限,便于进行高效的添加、移除和检查操作。
  • check_permission函数利用集合的成员运算符快速检查权限。
  • update_permissions函数展示了集合的并集和差集操作,用于动态管理权限。

通过这个实战案例,我们看到了集合在实际应用中的强大能力,特别是在处理元素的唯一性和集合运算方面。掌握这些技巧,将使你在处理数据和逻辑控制时更加游刃有余。

好了,今天的分享就到这里了,我们下期见。如果本文对你有帮助,请动动你可爱的小手指点赞、转发、在看吧!

付费合集推荐

Python编程基础

Python办公自动化-Excel

微信公众号批量上传发布系统

文末福利

公众号消息窗口回复“编程资料”,获取Python编程、人工智能、爬虫等100+本精品电子书。

精品系统

微信公众号批量上传发布系统

关注我👇,精彩不再错过

手把手PythonAI编程
分享与人工智能和python编程语言相关的笔记和项目经历。
 最新文章