经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种:
京东的面包屑
同样也有下面这种位置标题没有链接的面包屑,如下图:
中关村面包屑
大概猜想了一下,这在搜索引擎计算中会有一定的影响。
从搜索引擎原理的角度看,页面上的文本和链接是分开处理的。正文提取的时候,是将页面上的文本信息单独提取处理,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时候,是依靠页面上的文本进行计算。猜想,页面上的链接锚文本会被过滤掉,不参与TF的计算。
经常会看到,好多网站面包屑上的位置标题会被加上链接,像下面这种:
京东的面包屑
同样也有下面这种位置标题没有链接的面包屑,如下图:
中关村面包屑
大概猜想了一下,这在搜索引擎计算中会有一定的影响。
从搜索引擎原理的角度看,页面上的文本和链接是分开处理的。正文提取的时候,是将页面上的文本信息单独提取处理,而把页面上的链接等等会被提取到另一个表中去。TF(词频)计算的时候,是依靠页面上的文本进行计算。猜想,页面上的链接锚文本会被过滤掉,不参与TF的计算。