注册
登录
帮助
读吧书网主站
读吧书网官方论坛
»
安装使用
» 哪里有采集的教程嘛?
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
哪里有采集的教程嘛?
yipaihuyan
新手上路
帖子
32
威望
0
银币
0 个
点券
0 点
发短消息
加为好友
当前离线
1楼
大
中
小
发表于 2006-5-14 13:03
只看该作者
刚开始接触读吧,觉得很不错的程序,但是就是这个采集一开始还摸不着头脑,以前经常用PHP168和帝国的采集器。
哪里有教程嘛?关于读吧的采集,谢谢,先
UID
486
精华
0
积分
16
网站
阅读权限
10
注册时间
2006-4-14
查看详细资料
TOP
1230中文网
新手上路
帖子
49
威望
0
银币
0 个
点券
0 点
发短消息
加为好友
当前离线
2楼
大
中
小
发表于 2006-5-14 13:15
只看该作者
采集实际上都差不多,具体对照自带的采集规则就可以拉
UID
543
精华
0
积分
25
网站
阅读权限
10
注册时间
2006-4-29
查看详细资料
TOP
yipaihuyan
新手上路
帖子
32
威望
0
银币
0 个
点券
0 点
发短消息
加为好友
当前离线
3楼
大
中
小
发表于 2006-5-14 13:29
只看该作者
嗯,刚才粗略的看了一下系统内嵌的采集正则,大体上都看懂了。可是唯独这个看不太懂:
章节列表正则:
/<a class=tt href='\/Read\/Chapter\/[\d]+\/([\d]*)_0.html' title='[^>]+'>(.*)<\/a>/isU
哪位大侠,麻烦您解释一下上面的这个正则怎么理解?那个斜杠/和反斜杠\ 都分别是什么意思啊?
谢谢
UID
486
精华
0
积分
16
网站
阅读权限
10
注册时间
2006-4-14
查看详细资料
TOP
1230中文网
新手上路
帖子
49
威望
0
银币
0 个
点券
0 点
发短消息
加为好友
当前离线
4楼
大
中
小
发表于 2006-5-14 13:45
只看该作者
凡是出现“/”、“?”、“.”的地方,都需要加上\进行转义。
凡是数字,都可以用“[\d]+”来匹配。
任何内容都可以用“.*”来匹配。
正则以“/”和“/isU”作为起止。
需要匹配出的内容,用括号括起来。
UID
543
精华
0
积分
25
网站
阅读权限
10
注册时间
2006-4-29
查看详细资料
TOP
yipaihuyan
新手上路
帖子
32
威望
0
银币
0 个
点券
0 点
发短消息
加为好友
当前离线
5楼
大
中
小
发表于 2006-5-14 13:53
只看该作者
谢谢,懂了 :)
UID
486
精华
0
积分
16
网站
阅读权限
10
注册时间
2006-4-14
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››