发新话题
打印

[采集规则?] 想做规则分享,~~结果遇到匹配问题~~~[求助]

http://book.ddvip.com/   

这个网站 ,全文字的, 感觉还可以

地址:  http://book.ddvip.com/
书籍介绍地址:  http://book.ddvip.com/html/{read8bid}/index.html
书籍标题标签:<h2>||</h2>
书籍作者标签:作者:||</a>
书籍介绍标签:<div class="bookintro">||</div>
书籍分类标签:作品大类 ||<br|||玄幻-1#奇幻-1#武侠-2#仙侠-2#言情-4#都市-4#历史-3#军事-3#游戏-5#竞技-5#科幻-8#灵异-6#美文-7#同人-8#剧本-7#图文-8
章节列表地址:http://book.ddvip.com/html/{read8bid}/opf.html
卷标签:<td colspan="3" class="volume">||</td>
匹配正则 - 取得章节列表内容的变量组:|<a href=/(d+)_(d+).html>(.*)</a>|isU
上面变量组中为章节标题的变量组序号:{read8b2cvar3}
章节内容地址:http://book.ddvip.com/{read8bid}_{read8b2cvar3}.html
章节内容标签:<div id="content">||</div>
网站编码:gbk


看看我那里有错,指点一下,谢谢````

TOP

帮顶,问个批量问题
批采世纪的,
|read.2100book.com/files/article/html/d+/(d+)/|isU

开始批量采集

NaN% [0/0]初始化采集 ...

根本不开始。请问什么问题?
发不了主贴

TOP

引用:
引用魂人于2007-8-23 13:57发表的文章:
http://book.ddvip.com/   

这个网站 ,全文字的, 感觉还可以

地址:  http://book.ddvip.com/
书籍介绍地址:  http://book.ddvip.com/html/{read8bid}/index.html
书籍标题标签:<h2>||</h2>
书籍作者标签:作者:||</a>
书籍介绍标签:<div class="bookintro">||</div>
书籍分类标签:作品大类 ||<br|||玄幻-1#奇幻-1#武侠-2#仙侠-2#言情-4#都市-4#历史-3#军事-3#游戏-5#竞技-5#科幻-8#灵异-6#美文-7#同人-8#剧本-7#图文-8
章节列表地址:http://book.ddvip.com/html/{read8bid}/opf.html
卷标签:<td colspan="3" class="volume">||</td>
匹配正则 - 取得章节列表内容的变量组:|<a href=/(d+)_(d+).html>(.*)</a>|isU
上面变量组中为章节标题的变量组序号:{read8b2cvar3}
章节内容地址:http://book.ddvip.com/{read8bid}_{read8b2cvar3}.html
章节内容标签:<div id="content">||</div>
网站编码:gbk


看看我那里有错,指点一下,谢谢````
我现在在网吧,没装读吧,等回学校帮你看看吧

TOP

引用:
引用狼咖啡于2007-8-25 9:12发表的文章:
帮顶,问个批量问题
批采世纪的,
|read.2100book.com/files/article/html/d+/(d+)/|isU

开始批量采集

NaN% [0/0]初始化采集 ...

根本不开始。请问什么问题?
发不了主贴
正则表达式里,/要替换为\ /,还有.也要替换为\ .
引用:
zozi:
你说的是老版的规则。新规则只要在.前加/就可以了,其他都不要动
引用:
带头盔滴衰锅:
郁闷,偶半个月没能上网,规则现在又改了么?不太明白,以前的就如我所说的,现在不太清楚,等会儿弄个最新版的装了看看

TOP

搞不明白。。。

TOP

哪里不明白

TOP

发新话题