发新话题
打印

无法采集图版到本地,采集结果跟3.0一样

规则没有问题,文本内容都可以正常采集
可是到了图片的就采集不了,打开内容图片链接到原网站,本地也没有采集到的图片

内容:
<IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67a.gif\" border=0><BR><IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67b.gif\" border=0><BR><IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67c.gif\" border=0><BR>

已经设置前缀为http://10.121.214.10/book/pic

TOP

<IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67a.gif\" border=0><BR><IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67b.gif\" border=0><BR><IMG SRC=\"http://tupian.100hut.com/bookpic/gcd/67c.gif\" border=0><BR>
这个是你的采集规则???

TOP

规则如下:

英文标示  xm
站名  响马书库
地址  http  //www.xiangma.net/
书籍介绍地址  http  //www.xiangma.net/XuanHuanXiaoShuo/{read8bid}/
书籍标题标签  <span class="BookName">||</span>
书籍作者标签  <span class="AuthorName">||</span>
书籍介绍标签  本书简介  ||</div>
章节列表地址  http  //www.xiangma.net/XuanHuanXiaoShuo/{read8bid}/bookindex.html
卷标签  <span class="VolumeName">||</span>
章节列表正则  /<a href="(.*)" title='[^>]+'>(.*)<\/a>/isU
章节内容地址  http  //www.xiangma.net/XuanHuanXiaoShuo/{read8bid}/{read8cid}
章节内容标签  <span class='middle' id='content' name='content'>||</span>
图片前缀  http  //10.121.214.10/book/pic/

文本内容可以正常采集,批量也可以正常采集,可是图片采集完以后,还是远程的链接。

TOP

:em6::em6::em6::em6::em6::em6::em6:

TOP

xiangma.net 的附件采集需要程序进行部分修正。请稍后使用正式版的采集。

TOP

发新话题