在采集经常出现同一本书出现重复采集的事情。我不知道怎么会这样!但是我想应该是数据库结构设计不合理才导致小说的查询出现错误造成重新采集的!还有在数据管理方面可以备分导出。但是没有办法导入进去,我没有导入成功一次!别人我就不清楚了!但这也说明数据库有缺陷!
我在这里提出一个设想。实现的可能性非常的大。现在不管是什么程序都在使用数据库。小站没关系。但是大站的数据库只要设计的很理想就不行了!我们何不把数据保存到TXT呢!别的也许不行,但是小说绝对可以的!!
要是我们把一部小说的名字,作者,分类,简介,录入员,文章状态,授权,首发,原创,首发时间与更新时间,采集的规则标识和ID,小说的章节名称都保存为一个TXT文件。里面的名字,作者......只要前面加个标签,建议一个信息一行;章节另外加个标签,一个章节一行,这样整部小说的信息就完整了,这些也是现在3。3版本用数据库储存的.
这个文件的命名格式应该为:这里可以加个本小说在本站的ID-小说名字的第一字母-连载或者是小说完成的标识.txt
这些文件最好保存在相同的目录下.这样方便采集时少占用资源.
这样在采集更新的时候只要调用这个文件进行更新,因为这样是根据该文件去更新的。所以只要对比此文件中的章节信息肯定不会出错的!而数据库只要记录本书的名字和文件的名字,及该部小说的点击信息.书评建议在该部小说生成的目录里面生成另外一个TXT文件记录这些书评.该文件的格式可以是一个书评做为一段信息处理,也就是一段书评前面加个标签,把发表书评的用户,发表时间和内容储存为一段.
要是按照我这么说的来整个站点的资源消耗是最低的。不管是生成静态页面还是其他的!生成的时候整个小说就只要调用一个TXT文件的信息就够了,而数据库只要记录该部小说和该小说的点击数,及其他的一些内核信息.
我们小说站有个排行榜的!呵呵!差点把这个忘了!这个因为只要在采集或者发表完后把最后的章节的名字记录到数据库里面就可以了!这样在阅读页面的简介下面也可以加个最新章节了!
这样我们的数据库只要记录该部小说的ID,名称,点击,最后更新的章节这几个字段了!可以把章节表整个去掉了!
关于图片的连接问题.我想这个在TXT文件的章节名称后面加上个图片连接就可以了.文字的直接省了!!!不足之处希望大家踊跃提出来.让书生给我们做个不一样的程序出来.我上面提出的那些建议应该在技术上不成问题的.希望书生可以重新构造下数据库格式!
下面3楼的意思我已经知道了。但是我并没有说全部TXT化。我在上面就说了“数据库只要记录该部小说的ID,名称,点击,最后更新的章节这几个字段了”所以并不存在3楼所说的问题的!
欢迎其他朋友加上你自己的建议!!!!