这个我熟!!!
网页下载PDF文件也不是什么难事,根据不同网站的限制条件,我提供了几种解决方法,看看哪种更适合你。
一、打印保存
如果PDF不是PDF文件格式,找不到相关的元素,那有可能是HTML5网页预览模式,可以用打印法保存下载。
用edge浏览器打开网页后,在空白处点击鼠标右键或者按快捷键【Ctrl+P】,然后点击【打印】功能。
进入打印设置界面之后,将目标打印机设置为“另存为PDF”,然后点击【保存】。
在保存窗口中,选择PDF保存的文件夹,选好点击【保存】就可以了。
二、网页元素下载
如果网页是内嵌网页,没有提供下载保存按钮,可以通过网页审查元素找到下载源头。
右键选择「检查」或是按下「 F12」 进入开发者工具。
按快捷键Ctrl + F唤出搜索栏,输入关键词“PDF”搜索相关后缀的文件源,再从 Sources 中确定它的服务器源,从而推断得到它的路径。
三、截图提取
当然,最简单直白的就是先截图再转 PDF 文件,转换可以用图片转文字或者图片转PDF两种方式,
至于转换工具,可以下载一个掌上识别王,它有文字识别、PDF转换、翻译、压缩等效率工具,同时满足图片文字识别和PDF转换,批量转换速度更快。
图片转文字:如果截好的图片文字比较模糊,可以先识别图片上的文字,它可以批量添加多张图片,识别结果可以导出为Word、PPT、TXT,自己再合并成一份新的文档。
图片转PDF:支持添加多张图片,拖动可进行排序,转换可设置PDF的页面带下、页面方向、页面边距,转换后衔接得很自然。
四、抓取下载地址
最后,还有一种方式,就是下载一个idm下载器,它可以通过直链下载文件,只要网站提供了文件的直链地址,IDM都可以进行托管下载,TXT、PDF、DOCX、XLSX这些文档类型的文件都支持。
好了,以上就是我提供的四种PDF文件下载思路,希望可以帮到你。
觉得内容不错的话,欢迎关注 @趣小弟,顺便点个赞支持一下啦~
- 相关评论
- 我要评论
-