set是什么?括号和字典一样,但是元素和列表一样,但它也有自己的好处
set拥有类似dict的特点:
set称之为集合,也是存放元素仓库的一种,和列表、字典、元组等等是一样的;
先定义set类型的变量:
>>> s1 = {1,2,3}
>>> s1
{ 1, 2, 3}
>>> s2 = {4,4,5,6}
>>> s2
{ 4, 5, 6}
用大括号包裹,定义set类型。可以从s2的定义和输出来看,set类型是不能重复的
由于set的不重复属性,可以用它作为去重的一个方法:
>>> list1 = [1,2,3,4,5,1,2,3]
>>> list1
[ 1, 2, 3, 4, 5, 1, 2, 3]
>>> ss1 = set(list1)
>>> ss1
{ 1, 2, 3, 4, 5}
list1是列表类型,ss1是通过set初始化list1而得到了set类型
列表类型是可以遍历的,我们试试通过set(字符串)
来获取set类型
>>> str1 = "look at the screen"
>>> str1
'look at the screen'
>>> sstr1 = set(str1)
>>> sstr1
{' ', 'a', 'c', 'e', 'h', 'k', 'l', 'n', 'o', 'r', 's', 't'}
从目前的情况来看,set()里面放可遍历的类型,是可以得到set类型数据的,但同样的得到了更多信息
sstr1的开头是空格,不是look的l。然后观察整体数据,发现是按顺序排列的,set数据会自动排序。
接下来测试一下字典转set,看set中保留键值对的键还是键值对的值:
>>> dict1 = {3:2, 2:1, 1:3}
>>> dict1
{1: 3, 2: 1, 3: 2}
>>> sdict1 = set(dict1)
>>> sdict1
{ 1, 2, 3}
>>> dict2 = {'a':1, 'b':2, 'c':3}
>>> sdict2 = set(dict2)
>>> sdict2
{'a', 'b', 'c'}
说实话第一个例子举得不好,不管是键还是值,排序之后都是1-2-3。然后我就写了第二个例子,可以看出保留的是字典中键值对的键
测试到此结束,后面介绍set的常用函数:
函数名 | 介绍 |
---|---|
add | 添加元素;添加已有元素不报错 |
clear | 删除全部元素,清空整个set集合 |
pop | 弹出set集合中,最靠前的元素 |
remove | 删除一个元素,如果值不存在报错 |
update | 传入可遍历元素,然后拆分,最好全部放到set中。括号内无参数不报错 |
copy | 返回set参数的浅复制【大概有个印象就好,后面会详细解释】 |
以上就是set的基础函数。
当然set作为一个单独的类型,有他过人之处,看如下表格:
表达式 | 函数式 | 解释 | 备注 |
---|---|---|---|
x in s | 空 | 测试 x 是否是 s 的成员 | x是元素或set,s是set |
x not in s | 空 | 测试 x 是否不是 s 的成员 | x是元素或set,s是set |
s <= t | s.issubset(t) | 测试是否 s 中的每一个元素都在 t 中 | x和s都是set |
s >= t | s.issuperset(t) | 测试是否 t 中的每一个元素都在 s 中 | x和s都是set |
s 分隔符 t | s.union(t) | 返回一个新的 set 包含 s 和 t 中的每一个元素 | x和s都是set |
s & t | s.intersection(t) | 返回一个新的 set 包含 s 和 t 中的公共元素 | x和s都是set |
s - t | s.difference(t) | 返回一个新的 set 包含 s 中有但是 t 中没有的元素 | x和s都是set |
s ^ t | s.symmetric_difference(t) | 返回一个新的 set 包含 s 和 t 中不重复的元素 | x和s都是set |
这里就是set的重点了~看起来都够累的,更别说写了