搜索引擎索引更新常见策略解析

   作为个合格的SEO业者了解和熟悉引擎的基本算法和规则是非常有必要的,有助于我们更好的理解不断更新的各种算法,为我们的网站腾飞插上翅膀。下面我们来简单介绍下引擎文档更新的常见的策略。
   当有新的文档内容需要建立索引时,我们需要将新建立的索引和老的索引合并。合并的般方式有如下几种:


  a 完全重建:放弃老的索引,将原始的文档和新入的文档归并在起,完全重新建立个完整的新索引。
  b 再合并:对新入文档内容建立索引结构(链式),与已有的索引结构(顺序存储),通过归并算法,合并写入个新的索引文件。
  c 本地更新策略:每个倒排列表后都预留定冗余磁盘空间,新的索引对应的倒排项直接在已有索引文件中写入相应的位置。当没有冗余位置不足时,需对该倒排列表做迁移。由于可能发生迁移的关键词及其倒排列表比较多,我们需要另个映射表来表明,个关键词和其倒排链表磁盘位置的对应关系。这时,原来按照词典序顺序存储的各条倒排列表,可能被打乱了,因为部分倒排列表被迁移到其它位置了。
 
 
本文由SEO优化整理,本文不代表本站观点

本文地址:搜索引擎索引更新常见策略解析:/news/opti/234.html

 
®关于本站文章™ | 若非注明原创,默认 均为网友分享文章,如有侵权,请联系我们™
㊣ 本文永久链接: 搜索引擎索引更新常见策略解析