Python pydub音频处理

2023-02-28 03:09:02Python011

Python pydub音频处理,第1张

Pydub可以让你用简单的方式处理音频。

Pydub提供了简洁的高层接口，极大的扩展了python处理音频文件的能力。

GitHub链接： pydub-github

GitHub:

pydub的使用必须安装对应的依赖软件 ffmpeg 或 avconv

验证是否安装成功：

Open a WAV file

Open a mp3 file

Open a other file

切割音频

分贝操作

分贝（decibel）是量度两个相同单位之数量比例的计量单位，主要用于度量声音强度，常用dB表示。

音频链接

将一个文件添加到另一个文件的末尾

音频长度

淡入淡出

重复音频

再次淡入淡出

直接保存

所有ffmpeg支持的都支持

用标签保存结果（元数据）

实例：

将mp3文件转换成wav文件：

Python音频处理库 pydub

比如采样率为22050，音频文件有36s，那么x为长度为22050*36=793800的float。

用到了python库 Spleeter

抽象地了解下原理吧

参考文章是这篇：Spleeter: a fast and efficient music source separation tool with pre-trained models

原理文章是这篇 SINGING VOICE SEPARATION: A STUDY ON TRAINING DATA

粗略扫了一眼，原理主要是用U-Net进行分割，然后这个Python工具主要是利用了一个pre-trained的model。

参考链接：机器之心的一篇文章

纵轴表示频率（从0到10kHz），横轴表示剪辑的时间。由于我们看到所有动作都发生在频谱的底部，我们可以将频率轴转换为对数轴。

可以对频率取对数。

感觉这个参数蛮有意思的

整个频谱被投影到12个区间，代表音乐八度音的12个不同的半音（或色度）， librosa.feature.chroma_stft 用于计算。

先对音频进行短时傅里叶变换

其中每行存储一个窗口的STFT，大小为1025*1551

这里要注意理解怎么基于stft的结果来画频谱图

没太了解，感觉就大概知道有这么个量可以用到就行。

librosa.feature.spectral_centroid 计算信号中每帧的光谱质心：

1. 先理解连续傅里叶变换

2. 再理解离散傅里叶变换

对连续函数进行离散采样

3. 最后进入短时傅里叶变换

是先把一个函数和窗函数进行相乘，然后再进行一维的傅里叶变换。并通过窗函数的滑动得到一系列的傅里叶变换结果，将这些结果竖着排开得到一个二维的表象。

我用wpf画过wav的频谱图和语谱图，这里有个参考http://www.codeproject.com/Articles/488655/Visualizing-Sound

波形图应该更简单吧计算声音强度就好了至于mp3我想应该先解码成pcm

频谱音频结果频率原理

# 上一篇：编程语言有哪些？那个适合新手

# 下一篇：js如何用for做出七个评委打分

给您推荐相同类型的内容：

js冒泡排序详解
冒泡排序的原理就是讲两个相邻的元素进行比较，数值大的元素就会往后排就是换到走遍，而我们依次比较并把大数放在后面依次循环，那么最大的元素就会排在最后边，注意：在排完一次之后最后面的数已经是最大的了所以我们并不需再再次比较最后一个元素，也就是比
go语言适合做什么
go语言适用的领域有：Go语言主要用作服务器端开发，其定位是用来开发“大型软件”的，适合于很多程序员一起开发大型软件，并且开发周期长，支持云计算的网络服务。Go语言作为服务器编程语言，很适合处理日志、数据打包、虚拟机处理、文件系统、分布
go语言中判断文件是否存在如果有已存在则删除
.版本 2.程序集窗口程序集1.子程序 __启动窗口_创建完毕.如果 (文件是否存在 (取运行目录 () ＋ “1.dll”) ＝真)标签1.标题＝ “文件存在”.否则标签1.标题＝ “文件不存在”.如果结束以上参考百度知道本文实
如何用js获取mac地址
&lttitle&gt用js获取mac地址&lttitle&gt&ltscript language="javascript" type="textjavascrip
如何理解Golang中的range语句
1、下载go的zip文件。并且一定要把文件解压到c:go目录下。2、配置windows的高级环境变量。包括：GOROOT、GOOS、GOBIN、GOARCH。并且在path变量里面把c:gobin加入。以便可以在命令行直接运行go命令
Python做软件自动化测试的入门提问
用python做自动化测试，主要是接口测试和UI自动化测试。一、接口测试：http协议的举例:可以用python自带的urlliburllib2模拟，模拟前端向服务器发送数据，获取返回值后，进行校验和判断来进行接口测试。网上的例子也比较多
java如何建立数据库
JDBC连接数据库 •创建一个以JDBC连接数据库的程序，包含7个步骤：1、加载JDBC驱动程序：在连接数据库之前，首先要加载想要连接的数据库的驱动到JVM（Java虚拟机），这通过java.lang.Class类的
js里怎么遍历List
代码如下：&ltSCRIPT language="javaScript"&gtvar d = new dTree('d')d.add(1,-1,"用户组",&quo
R语言基础知识笔记
1、向量是用于存储数值型，字符型或者逻辑型数据的一维数组。执行组合功能的函数为c()，可以用来创建向量。向量可根据位置进行索引，需要用[]。 2、矩阵是一个二维数组，每个元素都拥有相同的模式，可通过函数matrix()创建矩阵。 3
js里怎么遍历List
代码如下：&ltSCRIPT language="javaScript"&gtvar d = new dTree('d')d.add(1,-1,"用户组",&quo
什么是javascript注入攻击？
Javascript注入攻击指的是通过在网页地址后加JavaScript代码，影响系统运作。JavaScript注入漏洞能发生作用主要依赖两个关键的动作，一个是用户要能从界面中注入JavaScript到系统的内存或者后台存储系统中；二是系统
vue中main.js的作用
main.js是项目的入口文件，项目中所有的页面都会加载main.js,所以main.js,主要有三个作用： 1.实例化Vue。 2.放置项目中经常会用到的插件和CSS样式。例如：网络请求插件:axios和vue-resource
go是什么编程语言？主要应用于哪些方面？
Go语言由Google公司开发，并于2009年开源，相比JavaPythonC等语言，Go尤其擅长并发编程，性能堪比C语言，开发效率肩比Python，被誉为“21世纪的C语言”。Go语言在云计算、大数据、微服务、高并发领域应用应用非常广
Python字典创建、基本操作以及常用方法
创建一个空字典自需要一对大括号即可,从已有的键-值对映射或关键字参数创建字典需要使用 dict 函数（类）把一个列表转为字典，列表的每一项都是长度为2的序列。还可使用关键字实参（**kwargs）来调用这个函数，如下所示
java导出word表格
首先我用的技术是poi这是代码，一个工具类得调用public class WordUtil {** * 基于模板文件导出 word 文档，此方法主要是用来处理文档中需要替换的文本内容，对图片和表格无效 ** @param te
《数量生态学：R语言的应用》第二版第三章-关联测度与矩阵------Q模式
生态学涉及多元统计方法，特别是排序和聚类，都是明确或不明确地基于所有可能对象或者变量之间的比较。这些比较通常采用关联测度（association meansures）(常称为系数或者指数)的形式，不管是样方还是变量之间的比较都是基于他
js中控制台输出方式
简单说一下JavaScript中的控制台输出的几种方法首先第一种也是我们最熟悉的 console.log()输出方式 1.console.log() 在控制台中打印，打印任意字符或者js的变量信息 console.lo
js中冒泡排序
冒泡排序就是一个数组里面的数进行排序，就是前一个和后一个数进行比较，如果第一个数大于第二数就换位置，然后依次比较，直至比较完所有的排序。function bubbleSort(arr){ constlen = arr.length
C语言编程：输入母字符串、子字符串，输出子字符串中首字母在在母字符串中的位置，求高手解题……
#include &ltstdio.h&gtint substrpos(char *s,char *t) {返回字符串s中包含子串t的首字母位置char *p = s,*q,*ptint poswhile(*p
js创建的link标签为什么没用
a标签的disable＝“true”属性只能使按钮灰掉，但还是可以点击跳转，要想无法点击，可以通过js删除href属性： function delLink(link) { link.disabled = truelink.setAttr
ruby是一种什么样的语言？
Ruby 是一种面向对象、命令式、函数式、动态的通用编程语言。在20世纪90年代中期由日本计算机科学家松本行弘设计并开发。遵守BSD许可证和Ruby License。它的灵感与特性来自于Perl、Smalltalk、Eiffel、Ada以及
js中控制台输出方式
简单说一下JavaScript中的控制台输出的几种方法首先第一种也是我们最熟悉的 console.log()输出方式 1.console.log() 在控制台中打印，打印任意字符或者js的变量信息 console.lo
ruby头盔为什么这么贵
成本很高。RUBY的用料颇具法式奢华风格，它的内衬为小羊皮所制，成本很高，因此在重量与舒适度上极具优势。Ruby设计风格是建立在复古传承经典设计的基础上，融合现代制造工业材料所营造出的摩登感，追求工艺、材料和美感的极致，每一个细节呈现出其精
如何在jsp中使用java类？
在jsp中使用java类举例如下:1.新建一个项目，在src文件夹下添加一个包：如:tianaoweb.com2.再在包中添加一个类：如package compublic class test { public String sd(){ r
js创建的link标签为什么没用
a标签的disable＝“true”属性只能使按钮灰掉，但还是可以点击跳转，要想无法点击，可以通过js删除href属性： function delLink(link) { link.disabled = truelink.setAttr
关于java包装的定义？
Java有八种基本类型，每种基本类型都有一个对应的包装类。包装类是什么呢?它是一个类，内部有一个实例变量，保存对应的基本类型的值，java课程培训机构http:www.kmbdqn.cn发现这个类一般还有一些静态方法、静态变量和实例方
js如何用for做出七个评委打分
给一个选手打分、去掉一个最高分、去掉一个最低分求平均得分和去掉两个分。思路：1.创建五名选手，放到vector中。2.遍历vector容器，取出每一位选手，执行for循环，可以把10位评委的打分放到的deque中。3.sort对deque中
js怎么控制滚动条使div在一定区间显示
js控制滚动条使div在一定区间显示方法步骤。一，新建一个html文件，命名为test.html，用于讲解如何使用JS控制DIV内容的滚动条。二，在test.html文件内，创建两个div模块，一个div模板包含另一个div模块。三，在te
广告公司取名带珠字吉祥的公司名字合集？
广告则是为商品进行推广的一种方式，当贸易行业不断的发展的时候，都是需要广告业从旁辅助的，因此，虽然广告形式有变，但是广告的行业始终是能够有不错的前景。对于一家广告公司来说，想要在公司的名字当中带珠字的时候，如何起名最为合适呢？带珠字的广告公
JAVA中反射是什么
JAVA中反射是动态获取信息以及动态调用对象方法的一种反射机制。Java反射就是在运行状态中，对于任意一个类，都能够知道这个类的所有属性和方法；对于任意一个对象，都能够调用它的任意方法和属性；并且能改变它的属性。而这也是Java被视为动态

推荐阅读

热门文章

最新发布

标签列表

Python pydub音频处理

给您推荐相同类型的内容：