书源规则
书源示例
{
"name": "顶点小说",
"url": "https://www.280xs.com",
"enc": "utf-8",
"info": {
"template": "t1",
"author": "//div[@id='maininfo']/div[@class='info']/h3",
"latestChapter": "//div[@id='maininfo']/div[@class='info']/span/a",
"latestChapterDate": "//div[@id='maininfo']/div[@class='info']/p[1]",
"cover": "//div[@id='img']/img/@src",
"intro": "/div[@id='intro']"
},
"chapter": {
"list": "//div[@class='article_texttitleb']/ul/li/a",
"url":"mulu.html"
},
"content": {
"text": "//div[@id='book_text']"
},
"RankingList":{
"title":"//em",
"list":"//a",
"types":"//div[@class='mian-cont']/div/div"
},
"search": {
"enc": "utf-8",
"searchUrl": "/searchbook.php",
"method": "GET",
"param": "search_key={{key}}",
"list": "//ul[@id='BookList']/li[@id='li1']",
"url": "//div[@class='nrrk']/div[@class='name']/strong/a/@href",
"name": "//div[@class='nrrk']/div[@class='name']/strong/a",
"author": "//div[@class='nrrk']/div[@class='name']/span[2]",
"cover": "//div[@class='pic']/a/img/@src",
"intro": "//div[@class='nrrk']/p",
"category": "//div[@class='nrrk']/div[@class='name']/span[1] #类别:",
"latestChapter": "//div[@class='nrrk']/dl/dt/a",
"latestChapterDate": "//div[@class='nrrk']/dl/dt/em"
}
}规则详解
注:不存在字段可不填 RankingList可以没有 只支持XPath语法
###通用规则
name:书源名
例:顶点小说
url:书源地址
例:https://www.280xs.com
enc:编码格式
例:utf-8info:详情页规则chapter:章节列表规则content:内容页规则search:搜索页规则RankingList:排行榜规则
###搜索页规则
enc:编码格式 目前只支持utf-8 和 gbk
例:utf-8
searchUrl:搜索页面url地址
例:/searchbook.php
method:搜索页请求方式 GET || POST
例:GET
param:搜索页面参数 {{key}} 会自动替换为书籍名 例:https://www.280xs.com/searchbook.php?search_key=遮天
例:search_key={{key}}
list:所有结果最外层
例://ul[@id='BookList']/li[@id='li1']
url:书籍url 一般是<a>
例://div[@class='nrrk']/div[@class='name']/strong/a/@href
author:作者
例://div[@class='nrrk']/div[@class='name']/span[2]
cover:封面图地址
例://div[@class='pic']/a/img/@src
intro:简介
例://div[@class='nrrk']/p
category:书籍类目
例://div[@class='nrrk']/div[@class='name']/span[1] #类别:
latestChapter:最新章节
例://div[@class='nrrk']/dl/dt/a
latestChapterDate:最新更新时间
例://div[@class='nrrk']/dl/dt/em排行榜 目前只解析首页
title:书名
例://em
list:所有排行榜url地址
例://a
types:分类
例://div[@class='mian-cont']/div/div详情页
author|latestChapter|latestChapterDate|cover|intro:可没有 用于补充搜索结果列表没有的情况
例: "info": {
"template": "t1",
"author": "//div[@id='maininfo']/div[@class='info']/h3",
"latestChapter": "//div[@id='maininfo']/div[@class='info']/span/a",
"latestChapterDate": "//div[@id='maininfo']/div[@class='info']/p[1]",
"cover": "//div[@id='img']/img/@src",
"intro": "/div[@id='intro']"
}章节列表
list:章节列表内所有链接地址 一般都是<a>
例: //div[@class='article_texttitleb']/ul/li/a
url:用于补充章节列表不在书籍详情页而是地址url 追加在后面的情况 例如:xxx/mulu.html 这种情况
例: mulu.html###章节内容
content:章节内容
例: //div[@id='book_text']补充说明
目前规则尚未稳定 自定义规则仅适用于高手自己尝试 请勿轻易尝试 对此引起的崩溃等问题概不负责。
