最新发布

# 2023-02-09
HarmonyOS技术特性
最近,随着华为的一批电子设备升级鸿蒙系统,鸿蒙系统的热度也逐渐升高。这里分享一下鸿蒙系统的定位及底层特性,让人们比较深入的认识一下鸿蒙系统。 HarmonyOS是一款面向万物互联时代的、全新的分布式操作系统。
# 2023-02-09
华为手机开机显示Harmony OS怎么解决
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
鸿蒙系统的缩小屏幕功能
鸿蒙系统的缩小屏幕功能说明如下：首先在屏幕的左侧、右侧滑动并长按打开侧边栏；在侧边栏选择需要分屏的应用，可上下滑动选择应用，可以点击最下方的按钮查看更多应用。选择应用后，将会在屏幕上直接以小窗口的形式显示；可按住上方的横条进行拖动，也可
# 2023-02-09
鸿蒙系统在线铃声免费吗
鸿蒙系统在线铃声部分是免费的。鸿蒙系统上有一些在线铃声是免费的，但不是所有都是免费的，毕竟运营商还是要赚钱的，如果不想付费可以在一些免费的资源里寻找一个自己最喜欢的，愿意的话可以找自己喜欢的铃声付费，付费的铃声还是比较丰富的，可以选择的很多
# 2023-02-09
华为harmonyos 3有哪些特性?
华为harmonyos 3的特性：1、HarmonyOS 3体验更安全、更流畅HarmonyOS3系统会进一步打通各个设备之间的协同性，并且在系统性能表现和隐私安全上有所加强。HarmonyOS 3在安全性方面，新增了剪切板隐私保护、模糊
# 2023-02-09
p50HarmonyOS新桌面有哪些功能？
HarmonyOS 提供服务卡片、大文件夹和小艺建议，让您把重要信息放在眼前，操作更快捷，屏幕也更个性化。P50手机系统为HarmonyOS 2，具体功能如下：状态栏：通过顶部状态栏查看手机状态、通知消息。大文件夹：无需展开文件夹，可一步打
# 2023-02-09
华为HarmonyOS与安卓对比：鸿蒙系统的强大不止于此
自从HarmonyOS 2上线后，HarmonyOS优越的性能表现让大家眼前一亮，我认为该系统最大的优点就是可在后台打开多个大型游戏且能保持游戏不中断，即后台保活率高。据测评媒体@小白测评的实验数据显示搭载H
# 2023-02-09
harmonyos是什么
harmonyos是华为鸿蒙系统。鸿蒙OS是华为公司开发的一款基于微内核、耗时10年、4000多名研发人员投入开发、面向5G物联网、面向全场景的分布式操作系统。鸿蒙的英文名是HarmonyOS，意为和谐。不是安卓系统的分支或修改而来的。与
# 2023-02-09
华为手机开机显示Harmony OS是什么情况?
如果您的手机开机进入Harmony OS界面、EMUI界面、FASTBOOT界面，可能因为如下原因：（1）可能是无意按到了开机键+音量键的组合键进入了特殊模式，建议您长按电源键15秒以上，尝试强制重启手机，即可正常进入手机桌面。温馨提醒
# 2023-02-09
HarmonyOs 网络安全配置，允许应用使用明文流量传输
"deviceConfig": { "default": { "process": "xxx", "directLaunch":

爬今日头条，各种失败经验，之后成功了

2023-02-26 15:42:02Python015

爬今日头条，各种失败经验，之后成功了,第1张

最近研究了一下js加密，发现今日头条比较适合练手，在头条获取数据的XHR中request参数有一项_signature参数，这个是就是经过js加密的数据。解决方案在最后。

先说寻找逻辑，叫顺藤摸瓜，藤是params中的key，瓜是js函数，在哪里摸，我用的是chrome F12，全局查找，就是在网址ctrl+f，注意看结果，前面有url这种一般都是在headers之类带着没什么价值，要看出来具体数据的。

然后在preview里，格式化看得清楚，还是查找signature。

这样就成功一大半了。顺便还找到了as和cp

as: e.as,cp: e.cp,

这个e也在前面定义了var e = ascp.getHoney()，然后在搜索getHoney，就找到了。

把这段复制进pycharm的zhu.js文件里，然后新建一个python文件来运行，nodejs直接运行也行。

额，报错了，execjs._exceptions.ProgramError: ReferenceError: md5 is not defined

赶紧查了一下md5是个加密模块， nodejs安装MD5 ，然后改装了改装一下，增加了var md5 = require('md5-node')运行成功。

然后就到了signature， _signature: i，i = TAC.sign("refresh" === t ? 0 : r.params.max_behot_time_tmp))

params.max_behot_time_tmp应该是在回传的数据里的max_behot_time了。

首次请求是0，后来的是根据前一次请求的后传数据继续请求。

不知所云，但还是按照老办法试试看能不能运行。

execjs._exceptions.ProgramError: TypeError: Cannot read property 'userAgent' of undefined。

这回我参考一下别人怎么办

原来要加useagent，

global.navigator={}

global.navigator.userAgent=

然后变成这样

调用发现又有错误：

好像说的是var data = TAC.sign(0)之前出现了一个不该出现的逗号，把它改成分号，果然成功了，

满怀欣喜的把signature，cp，as找到拼接成url发送，结果并不能返回数据。

有些忧郁的又看看别人怎么办，用selenium获取参数，phantomjs不维护了，听说chrome headless可以替代之，别人家说这么用，chrome还是打开窗口了，后来发现chromedriver.exe版本与chrome有严格的对应关系。官网这样说

总算是chrome是无头的了，现在只差跟着up主把参数弄出来就行了，因为有了前面的查找，selenium执行的函数名称也很清楚，

signature = brower.execute_script('return TAC.sign(0)')

果然出来一个参数，开心的拼接url发送请求还是没数据回来。。。

忧伤的想了好久，尝试了多次，终于在手机版里发现可以不用cp和as参数，用哪里生成的signature都能拼接出结果，只是max_behot_time是藏在前一页最后一项的信息里

用requests的session或者scrapy都能连续爬取了。不过m站将返回数量20写进了js里，更改params的参数也不能控制一次的爬取量还是很是遗憾。

结果

好像必须带着cookie才能爬取后续的，不然永远都只能爬取第一页的内容，获取cookie用request的session都不行可能只能用selenium获取cookie之后再来。忧伤。。。

1、抓取网页、分析请求

2、解析网页、寻找数据

3、储存数据、多页处理

翻页有规律：

很多网址在第一页时并没有变化，多翻下一页后规律就出来，比如豆瓣第一页和豆瓣第三页

发现start为40，limit=20，所以猜测start=0就是第一页，每页显示20条数据，对于第三页显示的参数可以一个个删除验证，可以减去不必要的参数， 但是删除前一定要做好数据的对比

（1） 文本框输入后产生一个请求，如常见的登录、注册页面

Referer：表示当前请求的来源

Request URL：表示实际请求地址

翻页后URL不变，该如何寻找请求？

如： http://www.zkh360.com/zkh_catalog/3.html

通过对比可以发现网站是通过pageIndex参数控制翻页的，？表示连接

接下来用抓包工具分析下，从第四页开始看URL就知道了，但是前面几面需要查看请求的参数，这里偏多，就切换到【Inspectors--Webforms】选项，看的比较直观

类似的网站还有今日头条，有兴趣的朋友可以去研究下

（可通过获取max_behot_time的值而改变as和cp）

1、Web开发

目前豆瓣、知乎、拉勾网等都是用的Python做开发，由此可见Web开发在国内的发展还是很不错的。

因为Python的web开发框架是最大的一个优势，如果你用Python搭建一个网站，只需要几行的代码，可谓是十分简洁。

2、网络爬虫

现在学习Python的人员中，大部分都是在学习爬虫，这也是Python的一大优势之一，最早用Python做网络爬虫的就是谷歌。

3、人工智能

发展潜力和Money不用多说，这都是大家所知道的，但目前的话，人工智能方面的工作还是比较少的，而且都是高学历人士，以后的话肯定是最具有发展潜力的方向了。

4、服务器运维

运维也不陌生，最开始一批学习Python的人，就是运维和测试的在职人员，因为Python对于他们的工作起到很大的作用，因为使用Python脚本进行批量化的文件部署和运行调整都成了Linux服务器上很不错的选择。

5、数据分析

Python所拥有的完整的生态环境十分有利于进行数据分析处理，比如，"大数据"分析所需要的分布式计算、数据可视化、数据库操作等，都可以通过Python中的十分成熟的模块完成。

想了解更多Python相关，可转：

数据参数还是的是都是

# 上一篇：C语言编程练习

# 下一篇：如何用C语言实现采用共享内存的进程间通信