注册
登录
帮助
读吧书网主站
读吧书网官方论坛
»
安装使用
» 為什么采集回來的小說內容頁格式都被過濾
‹‹ 上一主题
|
下一主题 ››
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
[BUG?]
為什么采集回來的小說內容頁格式都被過濾
zhangx1658
新手上路
帖子
5
威望
0
银币
9 个
点券
0 点
发短消息
加为好友
当前离线
1楼
大
中
小
发表于 2008-8-7 13:17
只看该作者
系统信息
PHP 版本
5.2.5
MySQL 版本
5.0.45
服务器操作系统
FreeBSD
当前数据库大小
10.14 M
书 网 版 本
3.5 Build 20080805
為什么采集回來的小說內容頁格式都被過濾。也沒有設定過濾或替換,采完回來全亂了格式
測試地址:
http://www.mxkan.com/html/K/20080807/kunlun/80.html
UID
1186
精华
0
积分
3
网站
阅读权限
10
注册时间
2006-12-8
查看详细资料
TOP
kukuxiao
注册会员
帖子
335
威望
4
银币
326 个
点券
0 点
发短消息
加为好友
当前离线
2楼
大
中
小
发表于 2008-8-7 13:33
只看该作者
我的也是 一堆
复制内容到剪贴板
代码:
UID
2377
精华
0
积分
176
网站
阅读权限
20
注册时间
2008-3-31
查看详细资料
TOP
cnopus
新手上路
帖子
2
威望
0
银币
4 个
点券
0 点
发短消息
加为好友
当前离线
3楼
大
中
小
发表于 2008-8-7 14:22
只看该作者
规则有问题吧!!!
UID
2781
精华
0
积分
1
网站
阅读权限
10
注册时间
2008-8-5
查看详细资料
TOP
zhangx1658
新手上路
帖子
5
威望
0
银币
9 个
点券
0 点
发短消息
加为好友
当前离线
4楼
大
中
小
发表于 2008-8-7 14:26
只看该作者
規則沒有進行任何替換和過濾。
UID
1186
精华
0
积分
3
网站
阅读权限
10
注册时间
2006-12-8
查看详细资料
TOP
yxdg2008
注册会员
帖子
124
威望
9
银币
176 个
点券
0 点
来自
星辰书网
发短消息
加为好友
当前离线
5楼
大
中
小
发表于 2008-8-7 16:05
只看该作者
这个替换为空就不会了.或者替换为 这样就可以.中间空4格
星辰书网
UID
1728
精华
0
积分
80
网站
http://www.xingchen88.cn
阅读权限
20
注册时间
2007-7-5
查看个人网站
查看详细资料
TOP
zhangx1658
新手上路
帖子
5
威望
0
银币
9 个
点券
0 点
发短消息
加为好友
当前离线
6楼
大
中
小
发表于 2008-8-7 16:31
只看该作者
像這樣也沒什么效果的。還有其祂代碼都被默認過濾了。如分行符之類的。而且有圖版的根本采不下來
UID
1186
精华
0
积分
3
网站
阅读权限
10
注册时间
2006-12-8
查看详细资料
TOP
wltx
新手上路
帖子
7
威望
0
银币
13 个
点券
0 点
发短消息
加为好友
当前离线
7楼
大
中
小
发表于 2008-8-7 16:34
只看该作者
你要进行替换的:将“ ”替换为两个空格,然后把被采集页的非“\n”(例如“<br>之类的”)的换行符替换为“\n”这样就不会出现你的那个问题了
UID
2427
精华
0
积分
4
网站
阅读权限
10
注册时间
2008-4-16
查看详细资料
TOP
pctit
注册会员
帖子
161
威望
3
银币
173 个
点券
0 点
发短消息
加为好友
当前离线
8楼
大
中
小
发表于 2008-8-8 08:23
只看该作者
那为什么IMG标签也会别过滤呢
UID
2756
精华
0
积分
87
网站
阅读权限
20
注册时间
2008-8-3
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››