如何在浏览器中打开PDF文件并实现预览的思路与代码

2023-05-02 00:52:03JavaScript034

如何在浏览器中打开PDF文件并实现预览的思路与代码,第1张

其实也就是简单的在浏览器中实现一个打开pdf文件，并有类似预览功能的边框。

其实在网上经常见到类似的页面，在浏览器中打开pdf文档，可大部分都是由于版权的原因使用了一些很特殊的技术，自然很难模仿了。

即使有直接在浏览器打开的例子，也必须手动点击一下链接然后才能打开pdf文件。如何直接打开，而不用点击链接呢？

本以为自己对js很熟，也就使用js模拟点击，可就是不管用，没办法，只能在网上继续寻找资料。最终想不到代码却很简单。

最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。

核心代码：

<html

xmlns="http://www.w3.org/1999/xhtml">

<head

runat="server">

<meta

content="IE=7.0000"

http-equiv="X-UA-Compatible"/>

<title>pdf阅读</title>

<script

type="text/javascript"

src="pdfview_files/jquery-1.7.2.min.js"></script>

<script

type="text/javascript"

src="pdfview_files/jquery.media.js"></script>

<script

type="text/javascript">

$(function

()

{

$('a.media').media({

width:

800,

height:

800

})

</script>

</head>

<body>

<form

id="form1"

runat="server">

<div

id="main">

class="media"

href="../../灾害性天气典型个例/暴雨/河套西部一次局地大暴雨成因分析.pdf"

id="PDFFile">

河套西部一次局地大暴雨成因分析</a>

</div>

</form>

</body>

</html>

使用jquery.media.js就可以直接把一个连接到pdf文件的链接打开

PDF.js 是基于开放的 HTML5 及 JavaScript 技术实现的开源产品。简单说就是一个 PDF 解析器。运用HTML5JavaScript（即pdf.js仅使用安全的web语言，不包含任何攻击者可以用的本地代码块）的PDF阅读器pdf.js，直接在标准的HTML页面上载入和渲染PDF文件, 还可以提高安全性（不需要安装第三方插件，安全性由浏览器保证），浏览器所做的安全措施已经为pdf.js提供了安全的运行环境。其对IE和 FireFox浏览器的要求是IE9+, FireFox19+。

在线示例： http://jsbin.com/pdfjs-helloworld-v2/1/edit ， http://jsbin.com/pdfjs-prevnext-v2/1/edit

源码：https://github.com/mozilla/pdf.js

官网：http://mozilla.github.io/pdf.js/

pdf.js VS 传统浏览器读取pdf

一般来说，PDF档案格式都是在浏览器中由外挂程式来描绘，通常是Adobe自己的PDF reader或来自其他供应商的描绘工具，但这些外挂通常无法充分运用PDF的特点，而且由于含有大量的受信任代码，使得Google Chrome浏览器必须运用SandBox沙箱原理，来检查PDF描绘工具是否遭到未知病毒感染。

使用adobe，必须在本地安装软件才能使用，而pdf.js不依赖环境、渲染速度快（测试过，确实很快）、安全性高。

pdf.js渲染PDF文件

pdf.js渲染PDF文件的流程：Fetch pdf (url / buffer) ——>canvas ——>渲染

如果要深入pdf的渲染，需要去研究pdf.js源代码。pdf.js可通过pdf文件的地址或pdf数据流获取pdf，具体实现是调用接口函数 PDFJs.getDoc(url/buffer)将pdf载入html，通过canvas处理, 然后渲染pdf文件。网上给出的都是通过url来获取pdf的例子，而我在做项目的时候，后台（python）要求是发pdf的数据流给前台，前台接收pdf的buffer,然后通过pdf.js来渲染。当然最初尝试buffer出现了很多问题，具体问题总结如下：

1）如何通过$.ajax接收后台发给前台的buffer数据；

2）如何将buffer传给pdf.js来处理（这里我使用了viewer.js, 所以需要考虑的是如何将buffer传给viewer.js来处理）；

3）如何将pdf.js转换成pdf.js可以接收的buffer格式；

（对应问题解决见代码注释）

注：viewer.js是pdf.js的扩展，其将打印、翻页、缩放等功能进行了实现，且界面非常好看。也就是说如果你引入了viewer.js，pdf的渲染和渲染之后的功能界面都已经帮你实现了，你不用自己去写界面。

先从官网：http://mozilla.github.io/pdf.js/ 下载代码，然后使用文件viewer.html , 我的html就是在viewer.html 的基础上修改的，下面我给出buffer的例子：

<!DOCTYPE html>

<head>

{% load static %}{% get_static_prefix as STATIC_URL %}

//convertDataURIToBinary()

//不知道什么原因如果后台直接将pdf的数据流发给前台，得到的是乱码，将数据转换成 Uint8Array始终不成功

//所以就让后台将发送之前的数据流做了base64编码发给前台，前台再解码得到的数据就不是乱码了。