发新话题
打印

[采集规则?] [原创]飞库规则 for 读吧 3.3 版[07-25更新]

前两天一门心思找免费空间做站,没多少时间,所以没来看我上次发的规则
今天终于把免费空间找到了,而且是自定义空间流量,拥有独立IP的~~速度也还过得去~~
所以就改了下天堂书吧的模板,改为3.3的,虽然还有些不完善,但也还是基本看得过去~~

刚才看了下,发现上次发的规则冒似不能用了?那就再写个吧~~

PS:飞库的封面有两个目录,我的规则中的是DownImg这个,要采集另一个的,改下封面标签中的DownImg就是了

TOP

突然发现有点问题,先别下载,等会儿我重新改下

TOP

我把你以前那个已经改好了~~~

TOP

谢谢你的无私奉献

TOP

哦,是么?你改的能够两种模式都匹配??
刚才突然发现在章节列表中使用了两种模式
一种是:<a href="5555.html" title="fjdsklfjksl">title</a>的方式
一种是:<a href="555.html" title="fdsfsdalkjlsd"><div class="xt">title</div></a>的方式
你改的两种都支持了么?

我现在就是想不出用什么正则方式来实现两种模式都匹配~哎,谁让我正则那么烂呢?

TOP

不支持就只改了你一个小地方
我是菜鸟级别的就是采集来没\\n 并且格式正常

TOP

感谢楼主无私奉献。继续努力,也许这个版主就是你的哦。

TOP

引用:
引用带头盔滴衰锅于2007-7-26 0:00发表的文章:
哦,是么?你改的能够两种模式都匹配??
刚才突然发现在章节列表中使用了两种模式
一种是:<a href="5555.html" title="fjdsklfjksl">title</a>的方式
一种是:<a href="555.html" title="fdsfsdalkjlsd"><div class="xt">title</div></a>的方式
你改的两种都支持了么?

我现在就是想不出用什么正则方式来实现两种模式都匹配~哎,谁让我正则那么烂呢?
这样写试试:

|<a href="([\d]+)\.html" title=".*">(.*)</a>|isU

直接匹配第一个即可。对于章节名中的html标签采集程序有自动过滤功能。

TOP

恩,已经搞定了

TOP

发新话题