读吧书网官方论坛's Archiver

7u5 发表于 2008-9-26 02:18

采集智能化的几点建议

1.采集增加一个从[color=navy]最后一章[/color]开始采集的功能。
*这点也许很容易,但很重要*

2.采集时,记住最后一次采集所用的规则及采集站点的书号,方便下次采集时再使用。
[color=red]这点能提升更新维护的效率[/color]。

3.采集规则,能用 [color=blue]书名 [/color]而非仅用书号作为识别。
我的思路大概是,在规则设置中增加目标站的搜索页,输入书名,然后根据结果页抓取书号,然后进行采集。

4.[b][color=navy]批量采集[/color][/b],能设置,根据[color=red]指定的一个数组书号[/color]来进行更新采集(和第一点[从最后一章开始更新]结合,对于提升更新效率,效果极佳)

或者,在书的字段里,增加一个每日必更识别。

[color=red][b]这样的好处:[/b][/color] 大大降低书站的维护成本,提升维护效率,也许原来需要10多个小时才能更新完6000、7000本书,更改完估计会在1-2个小时内完成。

[[i] 本帖最后由 7u5 于 2008-9-26 02:20 编辑 [/i]]

bdfc 发表于 2008-9-26 08:03

不错..........
还是等新版本吧
这个版本还有不少bug需要解决呢

影月榭 发表于 2008-9-26 09:06

很好啊。
我也发现 用R8 更新很是麻烦。非要跳过前面的章节才能更新。浪费好多时间。

页: [1]