发新话题
打印

[采集规则?] [原创]zozi帮忙看下这个采集规则怎么写

采集的网址是:http://book.ixxw.net/files/article/html/65/65159/index.html
这个是章节列表地址.

http://book.ixxw.net/files/article/html/{read8b2bvar1}/{read8bid}/index.html


解析书籍章节错误,采集规则出错,或者本书暂无章节
调试信息: bookaddress:http://book.ixxw.net/files/article/html//65159/index.html

中间那个没了!请哪位高手帮忙解决下!

另: <a href="1111338.html">第五章 修炼功法秘藏</a>这个<a href="在列表上面其他也有用到.

|<a href="(d+).html">(.*)</a>|isU  写这样是不是正确.会不会发生冲突.

先 谢谢了!

TOP

调试信息里 子ID缺失 说明{read8b2bvar1}这个变量没截取到 应该是 上面“匹配正则 - 取得书籍介绍内容的变量”这里的正则写错了

下面的写法也不对
复制内容到剪贴板
代码:
|<a href="(\d+)\.html">(.*)</a>|isU
缺2个转义符 d前 和.html前 就是反斜杠 奇怪现在论坛怎么把反斜杠过滤了
不知道是论坛把过滤了 还是你没写上

TOP

TOP

发新话题