【小项目-1】用Python进行人声伴奏分离和音乐特征提取

2023-03-05 04:40:02Python028

【小项目-1】用Python进行人声伴奏分离和音乐特征提取,第1张

比如采样率为22050，音频文件有36s，那么x为长度为22050*36=793800的float。

用到了python库 Spleeter

抽象地了解下原理吧

参考文章是这篇：Spleeter: a fast and efficient music source separation tool with pre-trained models

原理文章是这篇 SINGING VOICE SEPARATION: A STUDY ON TRAINING DATA

粗略扫了一眼，原理主要是用U-Net进行分割，然后这个Python工具主要是利用了一个pre-trained的model。

参考链接：机器之心的一篇文章

纵轴表示频率（从0到10kHz），横轴表示剪辑的时间。由于我们看到所有动作都发生在频谱的底部，我们可以将频率轴转换为对数轴。

可以对频率取对数。

感觉这个参数蛮有意思的

整个频谱被投影到12个区间，代表音乐八度音的12个不同的半音（或色度）， librosa.feature.chroma_stft 用于计算。

先对音频进行短时傅里叶变换

其中每行存储一个窗口的STFT，大小为1025*1551

这里要注意理解怎么基于stft的结果来画频谱图

没太了解，感觉就大概知道有这么个量可以用到就行。

librosa.feature.spectral_centroid 计算信号中每帧的光谱质心：

1. 先理解连续傅里叶变换

2. 再理解离散傅里叶变换

对连续函数进行离散采样

3. 最后进入短时傅里叶变换

是先把一个函数和窗函数进行相乘，然后再进行一维的傅里叶变换。并通过窗函数的滑动得到一系列的傅里叶变换结果，将这些结果竖着排开得到一个二维的表象。

收音机通过天线或线圈接受电磁波（电台发射信号附在一定频率的电磁波），通过检波电路把信号分离出来，通过放大电路增强信号，由功放电路加大功率，推动喇叭震动，转换成声波。这本身就是把电能转换成声能。你的想法是把空中的电磁波转换成电能？理论上是可以的，但实际上不好办。因为空中的电磁波能量很小，转换后没有使用价值。比如在大功率的发射天线附近，由于有很强的电磁波，你用一个螺旋线圈就可感应出电，甚至点亮灯泡。不过人家不会让你这么干的。

当然这并不会打击你的热情和设想，如果你成功了，所有使用电磁波的企业都会高价买你的专利，避免他们的倒闭。

电磁波你的频谱频率转换成

# 上一篇：如何在div+css中字体方向为竖排？

# 下一篇：MAC口红入手哪几个色号好？

给您推荐相同类型的内容：

hoo是什么意思
hoo的意思是：高兴。同时也有公司的意思，HOO品牌童装隶属于泉州凯浪服饰有限公司。该公司创办于1995年，位于“中国品牌之都”福建晋江。公司拥有标准化厂房3万平方米，现有专业牛仔童装设计师30多人，熟练技工700多人，是一家集设计、研发、
手机上有c语言编程软件吗？
如果在手机上学C语言编程，可以试试名为易历知食的软件，其内部有项功能叫微C程序设计，可以在手机上进行C语言编程练习，其自带的示例如下图：最简单的入门程序：运行结果：99乘法表程序：运行结果：其自带的C语言编程键盘界面：手机上的编程软件有
CSS3 动画
在 CSS3 出现之前，动画都是通过 JavaScript 动态的改变元素的样式属性来完成了，这种方式虽然能够实现动画，但是在性能上存在一些问题。CSS3 的出现，让动画变得更加容易，性能也更加好。 CSS3 中有三个关于动画的样式属
原生js实现文件上传
function saveUser() { var file = document.getElementById("file").files[0] 原生ajax
为什么golang适合中间件
Golang是一种静态类型的编程语言，具有高效性、安全性和可扩展性。它特别适合用于构建中间件，因为它可以更快地生成和处理数据，而且它可以构建可靠的、可维护的系统。 Golang还具有跨平台的能力，可以在各种操作系统中使用，而且可以使用内置的
C语言如何用free
#include &ltstdio.h&gt#include &ltmalloc.h&gtint main(){int *p = (int *)malloc(10)动态申请10字节内存空间free(p
MAC口红入手哪几个色号好？
小仙女的问题描述里说到了mac的 sweet sakura、twig、brick-o-la、Lady bug 这四款色号。这四款都是很美丽的，到底哪个好，还是先分别介绍一下吧！sweet sakura带闪的草莓樱花红
GO语言学习系列八——GO函数(func)的声明与使用
GO是编译性语言，所以函数的顺序是无关紧要的，为了方便阅读，建议入口函数 main 写在最前面，其余函数按照功能需要进行排列 GO的函数不支持嵌套，重载和默认参数GO的函数支持无需声明变量，可变长度，多返回值，匿名，闭包
怎么用CSS把网页导航条文字居中？
文字居中用到css2.0中的text-align属性；text-align属性是针对文字的对齐方式；其中值包括：left(向左对齐)center（居中）right（右对齐）justify（两端对齐）inherit（默认对齐方式）在这里我们将
怎么用java实现apriori算法
from operator import and_from itertools import combinationsclass AprioriAssociationRule: def __init__(self, inputfile
ruby头盔为什么这么贵
成本很高。RUBY的用料颇具法式奢华风格，它的内衬为小羊皮所制，成本很高，因此在重量与舒适度上极具优势。Ruby设计风格是建立在复古传承经典设计的基础上，融合现代制造工业材料所营造出的摩登感，追求工艺、材料和美感的极致，每一个细节呈现出其精
电脑如何双开两个微信
电脑如何双开，甚至多开微信都是可以的，操作很简单。具体步骤如下：1、在电脑桌面找到微信图标，鼠标右击，点击属性，在属性界面复制目标地址。2、新建文本文档，命名为“微信双开”，打开文档，粘贴刚刚复制的目标地址。3、将前后的双引号删除，将:(冒
什么叫css?它主要有什么作用?
CSS就是一种叫做样式表（stylesheet）的技术。也有的人称之为层叠样式表（Cascading Stylesheet）。 x0dx0ax0dx0a在主页制作时采用CSS技术，可以有效地对页面的布局、字体、颜色、背景和其它效果实
JS广告系统是什么意思呢。js具体啥意思呢。给我整的蒙蒙的
JS = JavaScript，一种计算机脚本语言，主要在web浏览器(客户端)解释执行 JS广告管理系统是大部分门户网站不可或缺的一个小功能，程序主要是实用使用很简单，在界面上没有过多修饰，但须自行整合修饰主要功能是方便站长对网站广告的
如何用java在指定目录下创建一个文件夹
具体的创建方法参照下面的实例:public class FileTest {public static void main(String[] args) { 根据系统的实际情况选择目录分隔符（windows下是，lin
css3中user-select的用法详解
user-select属性是css3新增的属性，用于设置用户是否能够选中文本。可用于除替换元素外的所有元素，以下是user-select的主要用法和注意事项的说明，更多信息可参考如下css3文档说明。参考资料：https:www.
最常用的办公软件有哪些
1、办公常用软件：WPS可能之前大家都使用的是WORD，不过相对于WORD小编更建议大家使用WPS，因为它是一款办公软件套装，可以实现办公软件最常用的各种功能。2、图片处理软件：PSPS全称PHOTOSHOP，可以帮助我们修复图片以及
r语言怎么算statistical power
有power.t.test()、power.anova.test()、power.prop.test()，另外CRAN上还有一个包叫pwr，里面有其他的算power的函数。详情看帮助文档吧。。。pow函数：CC++中的数学函数；pow(
css中的~号作用
很有意思偶尔会遇到一个奇特的符号，今天来看下css ~ 的意思：css中“~”是: p~ul{ background:red}为所有相同的父元素中位于 p 元素之后的所有 ul 元素设置背景：
电脑怎么添加输入法
1、首先，在桌面找到“这台电脑”图标，双击进入这台电脑的页面。iknow-pic.cdn.bcebos.com574e9258d109b3de61d74a31c2bf6c81800a4c7b"target="_bla
通过css3对百度地图maker动态扩展
以前使用过百度地图，有一些需要对某些特定标记物进行高亮和醒目标记，因此采用css3对百度地图的marker组件进行动态效果调试，以下是简单记录。效果如下：效果如下：效果如下：1、拨打电话其实就是一些只有手机支持的标签，&a
电脑如何连接外网?
问题一：电脑怎么连接外网打开浏览器，不管能不能上网都没关系，在工具中打开Internet选项，点连接，就会有个输入用户名与密码的框，你输入密码与用户名连接就行问题二：家里的电脑怎么连接外网基本不可能问题三：怎
js执行顺序
你现在是先定义了函数a，然后定义了函数b，然后再去执行函数a即使你把代码改成这样依旧能够正常运行a()function a() { b()}function b() { console.log(111)}因为JS运行环境会把
电脑语音输入怎么设置
电脑语音输入设置方法：品牌型号：台式机AH108系统版本：Windows10软件版本：搜狗输入法12.61、首先，我们需要确保电脑中已安装了麦克风。这样才能确保实现语音输入功能。2、鼠标点击“开始”菜单，从其列表中选择“设置”项打开
「测试开发全栈化-Go」(1) Go语言基本了解
作为一个测试，作为一个测试开发，全栈化+管理是我们未来的发展方向。已经掌握了Java、Python、HTML的你，是不是也想了解下最近异常火爆的Go语言呢？来吧，让我们一起了解下。Go 是一个开源的编程语言
chrome如何添加js插件
如果有科学上网软件，在谷歌浏览器上安装插件是步骤最简单的方法。只需要在下载安装、更新的时候需要科学上网设置，以后使用都不需要。请注意: 科学上网时，chrome添加js插件的操作步骤如下：1) 需要退出亚马逊店铺登陆，退出（log out)
电脑屏保广告如何取消
品牌型号：联想拯救者Y9000P系统：Windows 11 取消电脑屏保广告需要在电脑个性化设置中，将在锁屏界面上获取花絮、提示、技巧等关闭即可。以电脑联想拯救者Y9000P为例，取消电脑屏保广告的步骤分为4步，具体操作如下： 1点击个
js 数据结构map
1.JavaScript 的对象（Object），本质上是键值对的集合（Hash结构），但是传统上只能用字符串当作键。这给它的使用带来了很大的限制。 2.类似于对象，也是键值对的集合，但是“键”的范围不限于字符串，各种类型的值（包括对象
js怎么修改模块
同学很简单的，如下操作。1.一些购买的模板是可以改变的可变图片区域。一般就是这个按钮和对话框，可以在模板的特定模块中找到替换图片。2.但是，固定背景、边框和标题栏中使用的一些图片无法修改，因为模板制作者将它们封装在固定图片区域中。3.如果需
Go语言的%d,%p,%v等占位符的使用
这些是死知识，把常用的记住，不常用的直接查表就行了 golang 的fmt 包实现了格式化IO函数，类似于C的 printf 和 scanf。 type Human struct { Name string } var

推荐阅读

热门文章

最新发布

标签列表

【小项目-1】用Python进行人声伴奏分离和音乐特征提取

给您推荐相同类型的内容：