首页 - 神途礼包 > FUN/WeReadScan: 扫描“微信读书”已购图书并下载本地PDF的爬虫

FUN/WeReadScan: 扫描“微信读书”已购图书并下载本地PDF的爬虫

发布于:2024-04-15 作者:admin 阅读:140

About

一个用于的将微信读书上的图书扫描转换本地PDF/HTML的爬虫库.

谈谈为何而开发

不得不说,“微信读书”是一个很好的平台。但是美中不足很明显,用户购买了图书资源,但是只能在“微信读书”的中阅读或者做一些文字批注╮(╯▽╰)╭,这些功能相较于购买的纸质书籍显然是不足的。比如,作者就习惯于用iPad的相关类app做笔记,而“微信读书”并没有适配做笔记的功能。

因此,既然“微信读书”没有提供,那只好自己解决了。于是,经过2天的开发,终于有了这个爬虫脚本,也可以开心地做手写笔记了o( ̄▽ ̄)ブ

相关版本

在Sec-ant的建议下,参考了他的解决方案-,将其中最重要的获取#的部分脚本进行整合,得到了-HTML版本,可以直接自动化获得多本图书的HTML,更加高效。

Get

pip install WeReadScan-HTML

本项目需要使用,需要对具备基础的了解

Demo

话不多说,直接上代码

from selenium.webdriver import Edge
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.edge.options import Options
from WeReadScan import WeRead
options = Options()
options.add_argument("--disable-blink-features=AutomationControlled")
options.add_argument('disable-infobars')
options.add_argument('log-level=3')
options.add_argument("headless")
# launch Webdriver
print('Webdriver launching...')
driver = Edge(options=options)
# driver = Edge(service=service, options=options)
print('Webdriver launched.')
with WeRead(driver,debug=True) as weread:
    weread.login() #? login for grab the whole book
    weread.scan2html('https://weread.qq.com/web/reader/2c632ef071a486a92c60226kc81322c012c81e728d9d180')
    weread.scan2html('https://weread.qq.com/web/reader/a9c32f40717db77aa9c9171kc81322c012c81e728d9d180')

扫描结果样例:

几点说明:

需要 无头() 模式启动只有登陆后,才能扫描完整的图书资源;若不登陆,也可以扫描部分无需解锁的部分

API

.()

微信读书网页代理,用于图书扫描

Args

Usage

chrome_options = ChromeOptions()
chrome_options.add_argument('--headless')
headless_driver = Chrome(chrome_options=chrome_options)
weread = WeRead(headless_driver)

Login

..login(=15)

展示二维码以登陆微信读书

Args

Usage

weread.login()

..(, ='.', =True)

扫面微信读书的书籍转换为PDF并保存本地

Args

参数名类型默认值描述

str

必填

扫描目标书籍的URL

str

'.'

保存地址

bool

True

是否在该方法函数结束时展示生成的PDF文件

Usage

weread.scan2html('https://weread.qq.com/web/reader/a57325c05c8ed3a57224187kc81322c012c81e728d9d180')

over time

二维码

扫一扫关注我们

版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,请告知我们,本站将立刻删除涉嫌侵权内容。

相关文章