百度SEO优化的每种算法
搜索引擎检索和需求
1,搜索引擎的基本要求:快速响应,以毫秒为单位。
2,搜索引擎:一个大型网络应用软件,分布式计算,高效的索引和存储技术。(搜索引擎大多是高效的索引和存储技术,而不是每天与seo竞争)
3。搜索引擎的目的:为用户提供相关网页或其他信息(新闻、视频)
4。匹配:以某种形式包含搜索词的网页或其他信息。有一份清单,就是这样,我们是最关心的。
用户输入都是无规则的简单的,简单意味着抽象,抽象意味着有更多的可能性(举例:苹果、手机、黄色)。
6,为什么搜索引擎会提供相关的搜索和下拉框?
7、用户行为:不是所有的都在被发现之前被看到。用户可以查询少于两页的内容,因此搜索引擎需要在两页内显示尽可能多的可能性。(举例:seo,数据库查询)
网页收集
1,预先收集的[免费]数据(实时或预先收集的)
2,蜘蛛(负责的工作) 蜘蛛就是下载网页的一个小程序
3,调度(提高效率) 控制蜘蛛捉什么、多久捉一次页面等等
4、定期收集或增量收集搜索引擎将定期收集,即,大更新,增量收集基于每个站点更新的速度
5、搜索引擎更新周期(一个月?15天?) 具体没统计,不知道
种子站点(中心页面)搜索引擎首先从种子站点开始,种子站点有大量指向高质量站点的站点,例如“Good 123”URL。
7,深度优先级/广度优先级深度优先级是主页 - 列页面 - 内容页面,直接向深度捕获,广度优先级是首先捕获列页面以捕获内容页面
8。机器人规则是搜索引擎采用的爬行机制。一般来说,添加后台虚拟主机就足够了。淘宝网限制百度蜘蛛爬行。淘宝有足够的自尊心。
9,搜索引擎更新机制(更新快照)使搜索引擎认为原始或伪原始可以加快更新
10、尽量实施新的(搜索引擎/自己的数据库),搜索引擎不能保证,所以有时更改网站的标题和摘要,不会立即在互联网上显示。
预处理
网页预处理的一般过程:
1。关键字提取(噪声消除)噪声是网页的一个不重要的部分,它与网站的主题(如广告)无关,通常由frame和js调用。
2,切词,去除停止词 切词网址(参考):zyan.cc/demo/httpcws/; 停止词就是语气词,基本互联网上都出现的词
3、消除镜像页(完全相同)镜像页是相同的两页,所以在设置了伪静态后,使用机器人文件停止动态url
4。搜索引擎将过滤掉这些(垃圾页面),这对SEO优化非常不利,而搜索引擎将这些(垃圾页面)从搜索引擎中过滤出来(只需要少量额外的编辑,称为近似镜像页面)。
转载请注明: 爱推站 » 百度SEO优化的每种算法
评论列表(0)
发表评论