发新话题
打印

[采集规则?] 世纪采集规律[原创]

英文标识:            2100book
站名                 世纪
地址:                http://www.2100book.com/
书籍介绍地址:        http://www.2100book.com/modules/article/articleinfo.php?id={read8bid}
书籍标题标签:        <div class="artinfo_title">||</div>
书籍作者标签:        作    者:<!>!!!!</a></td>
书籍介绍标签:        内容简介:||本书公告:
封面标签:            <img src="http://bbs.2100book.com/files/img||"||http://bbs.2100book.com/files/img
书籍分类标签:        类  别:||</h2>|||武侠同人-2#奇幻魔法-1#仙侠异能-2#军事历史-3#都市生活-4#游戏竞技-5#校园言情-4#侦探恐怖-6
匹配正则 - 取得书籍介绍内容的变量:  |www\.2100book\.com/files/article/info/([\d]+)/|isU
章节列表地址:        http://read.2100book.com/files/article/html/{read8b2bvar1}/{read8bid}/index.html
卷标签:              |<a href="([\d]+)\.html">(.+)</a>|isU
上面变量组中为章节标题的变量组序号:        read8b2cvar2
章节内容地址:        http://read.2100book.com/files/article/html/{read8b2bvar1}/{read8bid}/{read8b2cvar1}.html






解析书籍章节错误,采集规则出错,或者本书暂无章节
调试信息: bookaddress:http://read.2100book.com/files/article/html//11/index.html

请高手给我看看 我研究一晚上 第一次搞规律    谢谢哈

  

TOP

晕``这个站本来就有很多错误```

TOP

你那规则错误地方太多了``我没法看。重新写了一个,你可以对比一下。

TOP

发新话题