英文标示: 100hut
站名: 百草堂
地址:
http://www.100hut.com/
书籍介绍地址:
http://www.100hut.com/Book/{read8bid}.aspx
书籍标题标签: <span class="booktitle">||</span>
书籍作者标签: 作者:||</a>
书籍介绍标签: <span class="comment"> || <BR>
匹配正则 - 取得书籍介绍内容的变量: /<a href="http:\/\/www\.100hut\.com\/Html\/Book\/([\d]+)\/([\d]+)\/index\.html">/isU
章节列表地址:
http://www.100hut.com/Html/book/{read8b2bvar1}/{read8bid}/List.html
卷标签: <span class="style3">||</span>
匹配正则 - 取得章节列表内容的变量组: /<a href="([\d]+)\.html"(.*)<\/a>/isU
上面变量组中为章节标题的变量组序号: read8b2cvar2
章节内容地址:
http://www.100hut.com/Html/book/{read8b2bvar1}/{read8bid}/{read8b2bvar1}.html
章节内容标签: <DIV id=booktext||</DIV>
这个网站貌似八错 我花了一宿做的采集规则 但是不知为什么采集不了
说是 解析书籍章节错误, 采集规则出错, 或者本书暂无章节
调试信息:
bookaddress:http://www.100hut.com/Html/book//7447/List.html
哪位大哥帮忙指点一下