发新话题
打印

[BUG?] 為什么采集回來的小說內容頁格式都被過濾

系统信息
PHP       版本
5.2.5

MySQL     版本
5.0.45

服务器操作系统
FreeBSD

当前数据库大小
10.14 M

书  网  版  本
3.5 Build 20080805


為什么采集回來的小說內容頁格式都被過濾。也沒有設定過濾或替換,采完回來全亂了格式

測試地址:

http://www.mxkan.com/html/K/20080807/kunlun/80.html

TOP

我的也是 一堆
复制内容到剪贴板
代码:
    

TOP

规则有问题吧!!!

TOP

規則沒有進行任何替換和過濾。

TOP

    

这个替换为空就不会了.或者替换为    这样就可以.中间空4格

TOP

像這樣也沒什么效果的。還有其祂代碼都被默認過濾了。如分行符之類的。而且有圖版的根本采不下來

TOP

你要进行替换的:将“ ”替换为两个空格,然后把被采集页的非“\n”(例如“<br>之类的”)的换行符替换为“\n”这样就不会出现你的那个问题了

TOP

那为什么IMG标签也会别过滤呢

TOP

发新话题