微信打电话和直接打电话有什么区别吗？为什么？

2023-05-28 00:05:02新手学堂0105

微信打电话和直接打电话有什么区别吗？为什么？,第1张

现在很多网友都选择用微信语音来代替直接打电话，这两者还是有一定区别的。首先，微信语音用的是4G或者5G流量网络，因此手机必须要有流量能上网，才能拨打电话。而且通话期间会持续产生流量，如果手机卡内的流量用光的话，则会产生额外的费用。不过语音通话所消耗的流量不高，所以费用也不会太贵。但如果手机所在区域没有3G、4G或者5G网络，那么基本上就无法使用微信语音通话功能了。

而直接打电话使用的专用语音通信网络。当手机所在的区域有4G网络的时候，打电话用的是4G Volte，如果没有4G网络的话，就会使用2G GSM或者CDMA网络。因此直接打电话要比微信语音通话更加稳定。

其次，微信语音通话为了尽量减少流量小号，保持通话的稳定，因此对语音数据压缩得比较厉害，通常为AMR格式。1秒中的AMR格式语音，消耗数据仅1KB左右，但这就会导致通话时双方的声音失真，通话效果一般。而直接打电话如果是走4G Volte通道的话，语音数据的码率可以达到24kbps，换算下来就是3KB每秒，质量是微信AMR格式的3倍，通话效果也会更加清晰一些。第三，微信打电话的前提是双方都有微信，且微信在手机后台运行当中。如果打电话的某一方没有微信号，或者一方微信没有在后台开启，那么就无法正常通话了。而打电话是手机最基本的一个功能，只要插了SIM卡，且没有欠费，就能互相拨打电话。因此手机直接打电话也比微信语音通话更加可靠。

最后，很多国产手机都支持通话录音的，有的手机还可以自动通话录音。而微信语音通话只能通过手机的录音机或者录屏功能才能完成通话录音，使用起来相对麻烦一些。不过也有一些网友为了防止被通话录音，特地选择微信语音来打电话。在这一方面，两者可以说各有优劣。总的来说，微信语音通话是不能完全代替手机打电话的，如果想要足够的可靠性和通话质量的话，还是直接打电话比较好一些。

不管是微软家的Cortana、三星家的S-voice苹果家的Siri，还是国内一些独立做语音辨认的比方讯飞、Rokid，在原理在实质上没有几差别：就是语音输入后，停止特征提取，将提取的特征值放进模型库里，再不时地停止锻炼和匹配，最终解码得到结果。

假如要细说的话就比拟复杂了，比方模型库中又分为声学模型和言语模型。其中言语模型是依据不同品种的言语，对词串停止统计建模，目前普遍采用的是基于(n-1)阶马尔可夫链统计的n元语法模型。

这里细致说下声学建模吧。首先经过前端特征提取取得声学特征，再进一步对声学特征停止统计建模。建模运用到的贝叶斯统计建模框架，也就是最大后验概率决策原则。这里算法这种深奥的东西就不说了，除非深度开发，否则直接套用就行了，我本人也是博古通今，还是念书的时分学的。

说说提取声学特征该如何完成：当语音输入之后，首先停止模电转换，将模仿信号转变为数字信号，再停止静音切除去掉无关噪音，然后停止分帧。将此时的信号分红一帧一帧之后（每一帧并不是独立存在的而是相互关联的），还要停止一系列的信号处置，包括预加重、加窗之后，再停止FFT变换之后，再经过Mel参数的滤波和取对数、离散余弦变换等一系列算法处置后，能够停止用梅尔频率倒谱系数（MFCC）停止特征提取，得到声学特征。

觉得越说越复杂了……后面简单点说吧。前面说了言语模型，而声学模型就是将声学特征统计建模后得到的。得到了模型库之后就能够停止模型锻炼和形式匹配了。

所谓模型锻炼就是指依照一定的原则，从大量已知语音形式中获取一个最具特征的模型参数。而形式匹配则相反，是依据一定原则，将未知语音形式与模型库中的某一个模型取得最佳匹配。

最后的解码过程又能够分红动态解码网络和静态解码网络两种：动态网络会编译一个状态网络并构成搜索空间，把单词转换成一个个的音素后将其依照语序拆分红状态序列，再依据音素上下文分歧性准绳将状态序列停止衔接。

而静态网络普通是针对一些特殊词（孤立词）的辨认网络，它的构造就简单多了：先将每条特殊词扩展成HMM状态序列，然后再计算得分，选择得分最大的作为辨认输出结果。由于静态网络是依据声学概率计算权重，不需求查询言语模型概率，因而解码速度很快。

这样的一个流程大致上就是语音辨认技术的主要原理。

最后再说点题外话吧，语音辨认技术其实应用以及很普遍了，比方在北美很多企业的电话自动效劳都会用到，只需用户直接说出想要的命令，就能够自动查询到需求的效劳，不需求像过去那样按键。手机应用里运用语音辨认技术比方微信的声音锁，讯飞、搜狗语音输入等等很多就不说了，而个人最看好的是声控语音拨号系统、家用机器人、智能家电等范畴，以语音交流的方式取代过去的传统人机互动。国内在这个范畴的语音辨认尝试也是相当多的，比方Rokid这样能够语音辨认命令还具有深度学习才能的家用机器人，能够自动播放视频、音乐，以至以后能够语音对话机器人叫个饿了么外卖，叫个滴滴出行等等。我今年夏天去参观过他们的语音辨认开发部门，他们用的是本人独立开发的一套流程在跑，整个语音模型库也是依据中国人发音习气（连读、口音）做的。当时测试的产品辨认度挺冷艳的，有种真正在人机交互的觉得，等于经过这个机器人接入口来控制其他电子产品，令人耳目一新。

微信的语音输入技术不是科大讯飞的。

在微信50新功能中，腾讯加入了语音输入功能，而该功能使用的是腾讯自己的技术。尽管在前期的版本中，微信已经有语音技术，但此时增加的语音输入是将语音直接转化为文字，这与早前的讯飞语音极为相似。

微信50增加语音输入技术，表明腾讯正式涉足语音领域，而这恰恰是科大讯飞的“一亩三分地”。业内担心，凭借腾讯强大的用户群以及在产品推广方面积累的雄厚实力，科大讯飞的饭碗可能会被抢。

扩展资料

科大讯飞语音云技术及语音输入法：

随着移动互联网时代的到来，科大讯飞率先发布了全球首个提供移动互联网智能语音交互能力的讯飞开放平台，并持续升级优化。

基于该平台，科大讯飞相继推出了讯飞输入法、灵犀语音助手等示范性应用，并与广大合作伙伴携手推动各类语音应用深入到手机、汽车、家电、玩具等各个领域，引领和推动着移动互联网时代大潮下输入和交互模式的变革。

作为移动互联网基础能力设施，“讯飞语音云”将上述业界领先的智能语音技术向移动互联网开发厂商和用户同时开放。移动互联网应用开发伙伴可以像使用水、电那样“即开即有、按需取用”，在很短时间内构建出“能听会说”的特色移动互联网应用。

从而使移动互联网语音创新开发的门槛显著降低、开发周期显著缩短，将有力于移动互联网应用的不断创新和丰富。此次与“讯飞语音云”同时发布的该平台第一个示范应用——“语音输入法”体验版，用户可以在科大讯飞公司网站免费下载客户端进行体验。

微信语音转换文字，究竟是怎么做到的？这是语音信号处理方面的问题，虽然人说话声音不同，但是所要表达的内容基本上相同。通过某些特征来进行提取识别，就可以由语音转换成文字了。

现如今有的人为了自己方便，给对方发语音，一发就是几十条。而且每一条都是那种满满的，一个字也容不下型的语音。

如果说处的环境，是适合听语音的环境还好。如果是在公共场合，把语音放出来，难免不会遭到别人的白眼。所以现如今把语音发给对方这样的形式，特别让人感到不舒服。