python第六讲:组合数类型

Python066

python第六讲:组合数类型,第1张

定义:集合是多个元素的无序组合

特点:集合类型与数学中的集合概念一致,几何元素之间无序、每个元素唯一、不存在相同元素,几何元素不可更待、不能存在可变数据类型。

非可变数据类型:整数、浮点数、复数、字符串类型、元组类型等

表示:{},元素间用,分隔

建立:{} 或者set{},建立空集合必须使用set{}

举例:

基本操作符:

增强操作符:

实例:

A-B

{123}

B-A

{'3','1','2'}

A&B

{'p','y'}

A|B

{'1','p','2','y','3',123}

A^B

{'2',123,'3','1'}

p123y

A

set()

1.包含关系比较:

True

False

2.数据去重

{'p','y',123}

['p','y',123]

定义:序列是具有先后关系的一组元素

特点:序列是一维元素向量,元素类型可以不同,元素可以相同:类似数学元素序列:元素间有序列引导,通过下标访问序列的特定元素

序列是一个基类类型,衍生为:字符串类型、元组类型、列表类型

序号的定义:正向递增序号、反向递减序号,与字符串中相似。

['.io',123,'python']

'oi.321nohtyp'

序列类型的通用函数和方法:

3

'y'

定义:元组类型是序列类型的一种扩展,一旦创建就不能修改

形式:元组使用()或者tuple()创建,元素之间用逗号分隔:小括号使不使用都可以。

举例:

('cat','dog','tiger','human')

(4352,'bule',('cat','dog','tiger','human'))

元组类型继承序列类型全部通用操作:操作符、处理函数、处理方法

元组类型创建后不能修改,因此没有特殊操作

('human','tiger',dog','cat')

'tiger'

定义:列表是序列类型的一种扩展,创建后其中的元素可以被随意修改

使用:[]或者list()创建,元素间可以用逗号隔开,列表中各元素类型可不同,无长度限制

['cat','dog','tiger',1024]

['cat','dog','tiger',1024]

列表类型操作函数及其方法:

['cat',1,2,3,4,'tiger',1024]

修改列表:

练习:

序列:元组和列表两种重要类型

应用场景:元组用于元素不改变的场景,更多用于固定搭配场景:列表更加灵活,它是最常用的序列类型

作用:表达一组有序数据并且处理问题;数据保护

元素遍历:

元组类型:

数据保护:不希望数据被程序所改变,转换成元组类型

('cat',1,2,3,4,'tiger',1024)

基本统计值需求:给出一组数并且理解

定义:总个数、求和、平均值、方差、中位数...

总个数:len()

求和:for...in

平均值:求和/总个数

方差:各数据与平均数差的平方的和的平均数

中位数:排序,然后... 奇数找中间一个,偶数中间两个的平均

映射:是一种索引和数据的对应关系,也是键和值的对应关系。

映射类型:由用户数据为定义索引

字典类型:数据的组织与表达的一种新的形态,是映射的体现。

键值对:键是数据索引的扩展,字典是键值对的集合,键值对间无序。

生成:{}和dict()创建,键值对之间用冒号:表示

举例:{<键1>:<值1>,<键2>:<值2>,...,<键n>:<值n>}

在字典变量中,通过键获得值:

<字典变量>={<键1>:<值1>,...,<键n>:<值n>}

<值>=<字典变量>[<键>]

<字典变量>[<键>]=<值>

用[]来向字典中增加或者索引键值对

举例:

'北京'

生成空字典:

de={}type(de)

<class 'dict'>

type(x) 返回变量x的类型

举例:

True

dict_keys(['中国','美国','法国])

dict_values(['北京','华盛顿','巴黎'])

实例:

'北京'

'伊斯兰堡'

('中国','北京')

练习:

1.映射的表达:映射无处不在,键值对也无处不在,统计数据出现的次数,数据是键,次数是值。

字典的主要作用:表达键值对的数据进而操作他们

2.元素遍历:

for k in d:

​<语句块>

定义:jieba库是优秀的第三方中文分词库,需要额外安装

安装方法:(cmd命令下)pip install jieba

作用:利用中文词库确定汉字间的关联概率,字间概率大的组成词组,形成分词效果,用户还可以向其中自定义的添加词组。

分类:精确模式、全模式、搜索引擎模式

精确模式:将词组精确的分开,不存在冗余单词

全模式:将所有可能的词组都扫描出来,有冗余

搜索引擎模式:在精确模式的基础上,将长词再次切分

举例:

['中国','是','一个','伟大','的','国家']

['中国','国是','一个','伟大','的','国家']

['中华','华人','人民','共和','共和国','中华人民共和国','是','伟大','的']

需求:一篇文章中出现的词的频率统计

分类:英文文本,中文文本

举例:

英文:哈姆雷特(hamlet)

中文:三国演义(threekingdoms)

1.集合类型概述

Python语言中的集合类型与数学中的集合概念一致,即包含0个或多个数据项的无序组合。

集合是无序组合,用大括号{}表示,它没有索引和位置的概念,集合中元素可以动态增加或删除。

由于集合元素独一无二,使用集合类型能够过滤掉重复元素。

集合类型有4个操作符,交集&、并集|、差集-、补集^,操作逻辑与数学定义相同

集合类型有一些常用的操作函数或方法

set()函数将其他的组合数据类型变成集合类型,返回结果是一个无重复且排序任意的集合。set()函数也可以生成空集合变量。

列表类型用中括号[]表示,也可以通过list(x)函数将集合或字符串类型转换成列表类型。

列表属于序列类型,所以列表类型支持序列类型对应的操作

1.序列类型有一些通用的操作符和函数

2.列表的索引

索引是列表的基本操作,用于获得列表的一个元素。使用中括号作为索引操作符。

可以使用遍历循环对列表类型的元素进行遍历操作,

基本使用方式如下

3.列表的切片

切片是列表的基本操作,用于获得列表的一个片段,即获得一个或多个元素。切片后的结果也是列表类型。

切片的使用方式:

切片获取列表类型从N到M(不包含M)的元素组成新的列表。当K存在时,切片获取列表类型从N到M(不包含M)以K为步长所对应元素组成的列表。

1.列表的操作方法

ls.append(x)仅用于在列表中增加一个元素,如果希望增加多个元素,可以使用加号+,将两个列表合并。

可以使用Python保留字del对列表元素或片段进行删除。

如下:

使用索引配合等号(=)可以对列表元素进行修改。

补:元组

Python的元组与列表类似,不同之处在于元组的元素不能修改。

元组使用小括号(),列表使用方括号。

元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。

Python语言中的字典使用大括号{}建立,每个元素是一个键值对。

使用方式:

键和值通过冒号连接,不同键值对通过逗号隔开。大括号可以表示集合,字典类型也具有和集合类似的性质,即键值对之间没有顺序且不能重复。

•字典的索引

列表类型采用元素顺序的位置进行索引。由于字典元素“键值对”中键是值的索引,因此,可以直接利用键值对关系索引元素。

利用索引和赋值 = 配合,可以对字典中每个元素进行修改。

使用大括号可以创建字典。通过索引和赋值配合,可以向字典中增加元素。

字典类型有一些通用的操作函数

字典类型存在一些操作方法

d.keys()返回字典中的所有键信息,返回结果是Python的一种内部数据类型dict_keys,专用于表示字典的键。如果希望更好的使用返回结果,可以将其转换为列表类型。

d.values()返回字典中的所有值信息,返回结果是Python的一种内部数据类型dict_values。如果希望更好的使用返回结果,可以将其转换为列表类型。

d.items()返回字典中的所有键值对信息,返回结果是Python的一种内部数据类型dict_items。

d.get(key, default)根据键信息查找并返回值信息,如果key存在则返回相应值,否则返回默认值,第二个元素default可以省略,如果省略则默认值为空。

d.pop(key, default)根据键信息查找并取出值信息,如果key存在则返回相应值,否则返回默认值,第二个元素default可以省略,如果省略则默认值为空。相比d.get()方法,d.pop()在取出相应值后,将从字典中删除对应的键值对。

d.popitem()随机从字典中取出一个键值对,以元组(key,value)形式返回。取出后从字典中删除这个键值对。

d.clear()删除字典中所有键值对。

此外,如果希望删除字典中某一个元素, 可以使用Python保留字del。

字典类型也支持保留字in,用来判断一个键是否在字典中。如果在则返回True,否则返回False。

字典可以遍历循环对其元素进行遍历

for循环返回的变量名是字典的索引值。如果需要获得键对应的值,可以在语句块中通过get()方法获得。

以上四种情况均为最常见的排列组合,从有无顺序和是否重复两个维度进行思考,建议理解并背诵。

在使用python计算排列组合之前,需要计算阶乘,可以有两种方式,一是使用math库中的factorial函数,二是使用如下的递归函数。

按照排列的公式:

按照组合的公式:

3.1 生日问题

假设一个班级中共有n个人,一年有365天,其中每天作为生日的概率是相等的,那么其中至少有两个人的生日在同一天的概率是多少?

此题属于全排列问题,需要反向思考,写出公式之后直接输入到python中计算

3.2 大乐透问题

大乐透的玩法是这样的,从35个红球中选择5个,从12个红球中选择2个,如果全中,那就中一等奖。那么请问,中一等奖的概率是多少?

此题属于组合问题,中奖的可能性为一种,因此分子为1,分母为所有的组合情况。