Python中冷门但非常好用的内置函数

2023-03-05 10:04:02Python017

Python中冷门但非常好用的内置函数,第1张

Python中有许多内置函数,不像print、len那么广为人知,但它们的功能却异常强大,用好了可以大大提高代码效率，同时提升代码的简洁度，增强可阅读性

Counter

collections在python官方文档中的解释是High-performance container datatypes，直接的中文翻译解释高性能容量数据类型。这个模块实现了特定目标的容器，以提供Python标准内建容器 dict , list , set , 和 tuple 的替代选择。在python3.10.1中它总共包含以下几种数据类型：

容器名简介

namedtuple() 创建命名元组子类的工厂函数

deque 类似列表(list)的容器，实现了在两端快速添加(append)和弹出(pop)

ChainMap 类似字典(dict)的容器类，将多个映射集合到一个视图里面

Counter 字典的子类，提供了可哈希对象的计数功能

OrderedDict 字典的子类，保存了他们被添加的顺序

defaultdict 字典的子类，提供了一个工厂函数，为字典查询提供一个默认值

UserDict 封装了字典对象，简化了字典子类化

UserList 封装了列表对象，简化了列表子类化

UserString 封装了字符串对象，简化了字符串子类化

其中Counter中文意思是计数器，也就是我们常用于统计的一种数据类型，在使用Counter之后可以让我们的代码更加简单易读。Counter类继承dict类，所以它能使用dict类里面的方法

举例

#统计词频

fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']

result = {}

for fruit in fruits:

if not result.get(fruit):

result[fruit] = 1

else:

result[fruit] += 1

print(result)

#{'apple': 2, 'peach': 3, 'lemon': 1}下面我们看用Counter怎么实现：

from collections import Counter

fruits = ['apple', 'peach', 'apple', 'lemon', 'peach', 'peach']

c = Counter(fruits)

print(dict(c))

#{'apple': 2, 'peach': 3, 'lemon': 1}显然代码更加简单了，也更容易阅读和维护了。

elements()

返回一个迭代器，其中每个元素将重复出现计数值所指定次。元素会按首次出现的顺序返回。如果一个元素的计数值小于1，elements()将会忽略它。

>>>c = Counter(a=4, b=2, c=0, d=-2)

>>>sorted(c.elements())

['a', 'a', 'a', 'a', 'b', 'b']most_common([n])

返回一个列表，其中包含n个最常见的元素及出现次数，按常见程度由高到低排序。如果n被省略或为None，most_common()将返回计数器中的所有元素。计数值相等的元素按首次出现的顺序排序：

>>>Counter('abracadabra').most_common(3)

[('a', 5), ('b', 2), ('r', 2)]这两个方法是Counter中最常用的方法，其他方法可以参考 python3.10.1官方文档

实战

Leetcode 1002.查找共用字符

给你一个字符串数组words，请你找出所有在words的每个字符串中都出现的共用字符（包括重复字符），并以数组形式返回。你可以按任意顺序返回答案。

输入：words = ["bella", "label", "roller"]

输出：["e", "l", "l"]

输入：words = ["cool", "lock", "cook"]

输出：["c", "o"]看到统计字符，典型的可以用Counter完美解决。这道题是找出字符串列表里面每个元素都包含的字符，首先可以用Counter计算出每个元素每个字符出现的次数，依次取交集最后得出所有元素共同存在的字符，然后利用elements输出共用字符出现的次数

class Solution:

def commonChars(self, words: List[str]) ->List[str]:

from collections import Counter

ans = Counter(words[0])

for i in words[1:]:

ans &= Counter(i)

return list(ans.elements())提交一下，发现83个测试用例耗时48ms，速度还是不错的

sorted

在处理数据过程中，我们经常会用到排序操作，比如将列表、字典、元组里面的元素正/倒排序。这时候就需要用到sorted()，它可以对任何可迭代对象进行排序，并返回列表

对列表升序操作：

a = sorted([2, 4, 3, 7, 1, 9])

print(a)

# 输出：[1, 2, 3, 4, 7, 9]对元组倒序操作：

sorted((4,1,9,6),reverse=True)

print(a)

# 输出：[9, 6, 4, 1]使用参数：key，根据自定义规则，按字符串长度来排序：

fruits = ['apple', 'watermelon', 'pear', 'banana']

a = sorted(fruits, key = lambda x : len(x))

print(a)

# 输出：['pear', 'apple', 'banana', 'watermelon']all

all() 函数用于判断给定的可迭代参数iterable中的所有元素是否都为 TRUE，如果是返回 True，否则返回 False。元素除了是 0、空、None、False外都算True。注意：空元组、空列表返回值为True。

>>>all(['a', 'b', 'c', 'd']) # 列表list，元素都不为空或0

True

>>>all(['a', 'b', '', 'd']) # 列表list，存在一个为空的元素

False

>>>all([0, 1，2, 3]) # 列表list，存在一个为0的元素

False

>>>all(('a', 'b', 'c', 'd')) # 元组tuple，元素都不为空或0

True

>>>all(('a', 'b', '', 'd')) # 元组tuple，存在一个为空的元素

False

>>>all((0, 1, 2, 3)) # 元组tuple，存在一个为0的元素

False

>>>all([]) # 空列表

True

>>>all(()) # 空元组

Trueany函数正好和all函数相反：判断一个tuple或者list是否全为空，0，False。如果全为空，0，False，则返回False；如果不全为空，则返回True。

F-strings

在python3.6.2版本中，PEP 498提出一种新型字符串格式化机制，被称为 “字符串插值” 或者更常见的一种称呼是F-strings，F-strings提供了一种明确且方便的方式将python表达式嵌入到字符串中来进行格式化：

s1='Hello'

s2='World'

print(f'{s1} {s2}!')

# Hello World!在F-strings中我们也可以执行函数：

def power(x):

return x*x

x=4

print(f'{x} * {x} = {power(x)}')

# 4 * 4 = 16而且F-strings的运行速度很快，比传统的%-string和str.format()这两种格式化方法都快得多，书写起来也更加简单。

本文主要讲解了python几种冷门但好用的函数，更多内容以后会陆陆续续更新~

1、Pandas：是一个Python包，旨在通过“标记”和“关系”数据进行工作，简单直观。它设计用于快速简单的数据操作、聚合和可视化，是数据整理的完美工具。

2、Numpy：是专门为Python中科学计算而设计的软件集合，它为Python中的n维数组和矩阵的操作提供了大量有用的功能。该库提供了NumPy数组类型的数学运算向量化，可以改善性能，从而加快执行速度。

3、SciPy：是一个工程和科学软件库，包含线性代数，优化，集成和统计的模块。SciPy库的主要功能是建立在NumPy上，通过其特定子模块提供有效的数值例程，并作为数字积分、优化和其他例程。

4、Matplotlib：为轻松生成简单而强大的可视化而量身定制，它使Python成为像MatLab或Mathematica这样的科学工具的竞争对手。

5、Seaborn：主要关注统计模型的可视化(包括热图)，Seaborn高度依赖于Matplotlib。

6、Bokeh：独立于Matplotlib，主要焦点是交互性，它通过现代浏览器以数据驱动文档的风格呈现。

7、Plotly：是一个基于Web用于构建可视化的工具箱，提供API给一些编程语言(Python在内)。

8、Scikits：是Scikits

Stack额外的软件包，专为像图像处理和机器学习辅助等特定功能而设计。它建立在SciPy之上，中集成了有质量的代码和良好的文档、简单易用并且十分高效，是使用Python进行机器学习的实际行业标准。

9、Theano：是一个Python软件包，它定义了与NumPy类似的多维数组，以及数学运算和表达式。此库是被编译的，可实现在所有架构上的高效运行。

10、TensorFlow：是数据流图计算的开源库，旨在满足谷歌对训练神经网络的高需求，并且是基于神经网络的机器学习系统DistBelief的继任者，可以在大型数据集上快速训练神经网络。

11、Keras：是一个用Python编写的开源的库，用于在高层的接口上构建神经网络。它简单易懂，具有高级可扩展性。

12、NLTK：主要用于符号学和统计学自然语言处理(NLP) 的常见任务，旨在促进NLP及相关领域(语言学，认知科学人工智能等)的教学和研究。

13、Gensim：是一个用于Python的开源库，为有向量空间模型和主题模型的工作提供了使用工具。这个库是为了高效处理大量文本而设计，不仅可以进行内存处理，还可以通过广泛使用NumPy数据结构和SciPy操作来获得更高的效率。

Python的常用包有哪些，分别有什么作用？

Python常用包

1、Numpy作用：数值运算库

2、Scipy作用：科学计算库

3、Matplotlib作用：基础可视化库

4、Pandas作用：数据处理库

5、Seaborn作用：高级可视化库

6、Scikit-learn作用：流行的机器学习库

推荐学习《python教程》。

元素是一个子类字符串列表

# 上一篇：小米Ruby可以双硬盘吗

# 下一篇：js的touchstart没有触发

推荐阅读

热门文章

最新发布

标签列表

Python中冷门但非常好用的内置函数

给您推荐相同类型的内容：