Search:标签

Google搜索引擎原理概述

引项列表被存入到数据桶(Barrels)中,并生成以文档号(docID)部分排序的 顺排档索引。索引项根据其重要程度分为两种:当索引项中的关键词出现在URL、标题、锚文本(Anchor Text)和标签中时,表示该索引项比较重要,称为特殊索引项(Fancy Hits);其余情况则称为普通索引项(Plain Hits)。在系统中每个Hit用两个字节(byte)存储结构表示:特殊索引项用1位(bit)表示