[求助] python 如何爬取网页上调用JS函数打开的视频链接

2023-02-22 03:15:01Python010

[求助] python 如何爬取网页上调用JS函数打开的视频链接,第1张

selenium + phantomjs 模拟点击按钮，或者另写代码实现js函数openVideo()；

顺着第一步再去解析新页面，看看能否找到视频的原始地址；

假设视频的原始地址第二步找到了，在通过视频的原始地址下载视频就OK啦。

思路如下：

使用urllib2库，打开页面，获取页面内容，再用正则表达式提取需要的数据就可以了。

下面给你个示例代码供参考，从百度贴吧抓取帖子内容，并保存在文件中。

# -*- coding:utf-8 -*-

import urllib2

import re

url='

page=urllib2.urlopen(url).read().decode('gbk')

none_re=re.compile('<a href=.*?>|</a>|<img.*?>')

br_re=re.compile('<br>')

title_re=re.compile('<h1 class="core_title_txt " title="(.*?)"')

content_re=re.compile('<div id="post_content_\d*" class="d_post_content j_d_post_content ">(.*?)</div>')

title=re.search(title_re,page)

title=title.group(1).replace('\\','').replace('/','').replace(':','').replace('*','').replace('?','').replace('"','').replace('>','').replace('<','').replace('|','')

content=re.findall(content_re,page)

with open('%s.txt'%title,'w') as f:

for i in content:

i=re.sub(none_re, '', i)

i=re.sub(br_re, '\n', i)

f.write(i.encode('utf-8').strip()+'\n')

1：可以使用opencv读取。

2：其代码如下：

#includehighgui.h

#includecv.h

//从摄像头中读入数据

int main(int argc,char** argv)

{

cvNamedWindow(Example1,CV_WINDOW_AUTOSIZE)

CvCapture* capture//初始化一个CvCapture结构的指针

if(argc==1)

{

capture=cvCaptureFromCAM(0)//如果参数为1，则从摄像头中读入数据，并返回一个CvCapture的指针

} //注：《学习OpenCV》中此处用cvCreateCameraCapture为错

else

{

capture=cvCreateFileCapture(argv[1])

}

assert(capture!=NULL)//断言（assert）使用，检查capture是否为空指针，为假时程序退出，并打印错误消息

IplImage* frame

while(1)

{

frame=cvQueryFrame(capture)//用于将下一帧视频文件载入内存（实际是填充和更新CvCapture结构中），返回一个对应当前帧的指针

if(!frame)

break

cvShowImage(Example1,frame)

char c=cvWaitKey(33)

if(c==27) break//出发ESC键退出循环，读入数据停止

}

cvReleaseCapture(capture)//释放内存

cvDestroyWindow(Example1)

}

指针视频数据原始代码

# 上一篇：青青子衿什么意思?

# 下一篇：君实生物688180股吧

给您推荐相同类型的内容：

如何用java编写一个矩阵的转置？
int a[][] = {{1,2,3,4},{1,2,3,4},{1,2,3,4},{1,2,3,4},{1,2,3,4},{1,2,3,4},{1,2,3,4}} int b[][] = new int [4][7]
Spark 推荐算法-协同过滤-java的语句意思
协同过滤(Collaborative Filtering)的基本概念就是把这种方式变成自动化的流程协同过滤主要是以属性或兴趣相近的用户经验与建议作为提供个性化的基础。透过协同过滤，有助于搜集具有类似偏好或属性的用户，并将其意见提供给同一集群
java课程设计创意小游戏
① 求Java课程设计—小游戏(含源代码)hi.srxboysitem8ce4743da1adc991c2cf29c4Tank——坦克大战（简洁版）源代码-------（此文档是自己在韩顺平教程总结而来）*功能:1.防止敌
CSS基础选择器<标签、id、类选择器>(二)
属性:通过属性的复杂叠加才能做出漂亮的网页。选择器:通过选择器找到对应的标签设置样式标签选择器:就是用标签名来当选择器 1&gt所有的标签都能做选择器，例如:div、p、 ul、 li、 a、 span、body等等
苹果电脑截图快捷键
按住【command】【shift】【3】这三个键即可截取全屏。苹果mac怎么截图？在我们平常电脑的使用中经常会运用到截图这一功能，由于mac与我们平常使用的微软系统在操作上有很大的不同，截图快捷键介绍，方法一：1、截取全屏，按住【comm
jsp如何返回上一层目录？超急！！
试一试用项目路径找&ltscript type="textjavascript" src=“你所需要的js的网络地址"&gt&ltscript&gt没个东西都有对应的地址，像
如何用css改变输入框样式
中文字符的中线和英文字符的中线定义是不一样的，你在设置输入框与文本居中对齐的时候，最好将文本的字体样式设置成英文字体，比如font-family:verdana这样有助于解决中线问题。然后再给输入框添加 vertical-align:mid
python字典怎么排序
python字典怎么排序？定义一个字典类型mydict = {2: '小路', 3:'黎明', 1: '郭富城', 4:'周董'}可分别打印 key和val
求将十进制数转为十六进制数的JS或PHP代码
JS十进制转其他进制代码如下var m = 10document.write(m.toString(2) + "&ltbr&gt") 显示为 1010二进制document.write(m.toS
python身高测算输入格式输入的三行数据如下
第一行输入一个数字，代表爸爸的身高，第二行输入一个数字，代表妈妈的身高，第三行输入一个数字(1或-1)，代表性别系。假设孩子的身高完全由爸爸和妈妈的遗传因素决定，预测一下长大后孩子的身高。孩子未来的身高=(爸爸的身高+妈妈的身高+13乘以性
怎样学习电脑基础知识？
快速学会电脑基础知识：1、开机关机：零基础学电脑最先要学的是正确开机关机，不建议用休眠模式。开机很简单，直接按主机的电源即可，显示器可以不关。正确的关机方式是鼠标点击电脑桌面左下角的开始，然后点击关闭计算机即可，如果没有鼠标，也可以按照顺序
使用Python判断输入的整数位数并求出每个位上的值
对于给定的正整数N(N最大为5位数)，求其整数位数，及个位、十位、百位、千位和万位的值，同时，举个例子，如果N是一个三位数，那么，只求其个位、十位和百位。 6.总结，不管是五位数还是四位数还是多少位数，求其中间的位的值的规则都是类
js 函数如何去调用另一个函数中的函数？
首先把这两个函数都定义数来。定义被调用函数（这类函数一般都是一个公用函数，如果不是公用可以和调用函数写在一起）。function publicMethod(act1,atc2){定义调用函数：调用的函数 act为需要的参数，自
js 截取或者替换字符串中的数字实现方法
在js操作表格时，我们经常会需要得到或者修改name中的下标，如：name="cust[1]custName"替换：name.replace([d]+,num)num为你需要替换成的数字变量获取：name.m
关于CSSHTMLJAVASCRIPT的10道选择题
1.D2.D3.C4.C5.B6.B7.B8.A特别是后面三个题目，花了时间喔，还要按题目要求把JS或JQ代码写出来执行，再选答案。希望对你有帮助。这题目应该网页前端的题目喔。哈哈，还好我是搞前端开发的。一．单选题（共41小题，每题1.
动画专业要求什么样的电脑配置
电脑硬件要在内存、cpu、显卡、主板需要很好的配置：1、显卡：选择独立显卡，独立显卡2g以上最佳，使运行动画软件和动画帧数更快。 2、内存：内存要大，运行软件需要缓冲空间，需要足够大的空间让电脑更好的运行。 3、cpu：处理
为什么js不能操作本地文件
JS是浏览器脚本文件，实现页面内容的计算、显示和交互。例如点击按钮弹出一个详细信息，播放音频，展开二三级菜单，显示更多内容及滚动显示轮播等等。页面样式和弱交互一般CSS可以实现，但复杂的就需要JS来实现。随着JS的发展，JS在浏览器端能实现
vue中实现 ‘换肤切换样式主题’ 功能的三种方式详解（干货）
App.vue： demo.vue（css）： demo.vue（html）： demo.vue（js）：效果：[图片上传失败...(image-c7afd3-1640662035396)]
如何用javascript获取<img> 中的id?
先获取img标签，再访问id值步骤1、定义一个img&ltbody&gt &ltimg src='' id='test'&gt&ltbody&am
用C语言如何对MySQL数据库进行操作
有时为了性能，我们会直接用C语言来开发相关的模块，尤其在我们的web应用中，虽然PHP、JSP等脚本均提供了MySQL的接口，但是显然直接使用C语言具有更好的安全性和性能，Michael以前用PHP开发的多个项目中就使用了C语言编写的这类接
引入在css文件夹下的style.css文件,哪种引用方法正
引入在css文件夹下的style.css文件，行内样式引用方法正确。根据查询相关公开信息显示：行内样式是最简单的一种style.css使用方式，就是在html标签中使用style属性添加CSS样式。分类:电脑网络问题描述:
怎么在dos下运行java文件？
1。改为haha.java.之后可以把文件放在D盘根目录下x0dx0a2.开始--运行--输入cmdx0dx0a3.进入dos后，在光标定位处输入d:(回车）x0dx0a4.D:javac haha.java (回车）x
python的推荐书籍有哪些
零基础如何学好python，作为一个学了python两三年的过来人，我当初也是从0开始一路摸索过来的，这里给想学python的小白们分享一点我的学习心得。1.《笨方法学Python》、《流畅的python》、《EffectivePython
现在适合女生的笔记本电脑有哪些？想给女儿买个电脑让她带去学校，哪个好？
我给女儿买的荣耀最新轻薄笔记本magicbook酷睿i7版，就是一个比较适合女生的笔记本电脑，供参考。1.很薄，拿着很轻，我女儿也说拿着不费劲。2.续航时间比较长，我们家试过，10来个小时没问题，这样她在去学校的火车上，也能多点消遣的娱乐。
在python的类定义时如何实现对三种访问权限的控制
在python的类定义时实现对三种访问权限的控制步骤如下：1、实现-new-方法。2、将类的一个实例绑定到类变量_instance上。3、该类还没有被实例化过，new一个该类的实例，并返回。pythonwithopen改变文件权限的方法：1
拳皇97风云再起电脑怎么暴气啊
暴气按键设置如下：载入好拳皇97后，在菜单栏处—游戏—重新定义按键—重新定义按键。下面即为“宏”设置：A B C D或者1 2 3 4分别就是轻拳、轻脚、重拳和重脚的意思。I 是超重击键（反击）：34+就是重拳和重脚一起按的意思。
css3图片文字实现动画效果
&lt!doctype html&gt&lthtml&gt&lthead&gt&ltmeta charset="utf-8"&gt&lttitle&
css基础语法
CSS 的出现，实现了网页的结构和样式分离。美容师！ CSS 规则由两个主要的部分构成：选择器，以及一条或多条声明 CSS 规则由两个主要的部分构成：选择器，以及一条或多条声明以内嵌式样式表为例 vs code
css基础语法
CSS 的出现，实现了网页的结构和样式分离。美容师！ CSS 规则由两个主要的部分构成：选择器，以及一条或多条声明 CSS 规则由两个主要的部分构成：选择器，以及一条或多条声明以内嵌式样式表为例 vs code
IntelliJ中怎么取消js验证
下面有俩种解决方法： 1. 选中当前工程—properties—MyEclipse—validation—Excluded Resource下找到须要作废验证的文件或者文件夹就可以了。 2. 找到在项目路径下面的.project文件中配置了