搜索引擎(简称蜘蛛)优化的基本原理主要包括:抓取、过滤、收录、展现排序。
蜘蛛首先在互联网中发现、搜集网页信息,同时对信息进行提取和过滤建立索引库;当用户在搜索引擎输入查询的关键字,此时搜索引擎会在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
各大搜索引擎抓取程序(蜘蛛)名称主要有:
百度蜘蛛:Baiduspider
谷歌机器人:Googlebot
360蜘蛛:360Spider
SOSO蜘蛛:Sosospider
雅虎蜘蛛:“Yahoo! Slurp China”或者Yahoo!
有道蜘蛛:YoudaoBot,YodaoBot
搜狗蜘蛛:Sogou News Spider
一、搜索引擎抓取页面的方式:
1.外部链接抓取,蜘蛛顺着网页链接从互联网一个网站进入另一个网站,理论上蜘蛛访问的众多网页链接都会被搜索引擎抓取,所以这也是发外链一个原因;
2.主动提交链接,即站长主动提交网站的页面给搜索引擎,告知搜索引擎我我的网站你可以来抓取了,但是提交链接不代表一定会被收录;
3.蜘蛛自动搜索,互联网上高质量的页面是很稀缺的,蜘蛛会主动搜寻这样的页面进行抓取收录,所以我们网站要经常发表高质量文章引导蜘蛛来抓取。
二、如何知道搜索引擎抓取了我们的页面
1.通过百度站长工具抓取频次了解搜索引擎抓取网站页面情况
2.通过服务器日志了解,网站日志会显示哪种搜索引擎,何时来访问,访问了哪个页面
三、影响搜索引擎抓取网站页面的因素
1.网站路径过长;2.中文路径不会被蜘蛛抓取;3.网站页面有大量搜索引擎无法识别的flash、图片、Javascript元素和使用frame和iframe框架结构。
四、搜索引擎过滤功能
1.过滤的原因,过滤互联网大量的无价值页面,死链接,欺骗页面
影响过滤的因素
1.搜索引擎是一个程序,它有不能识别的因素,不认识的代码:JavaScript、flash、iframe、图片。 Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、图片中的文字,百度无法识别。建议为图片加alt说明,因为这样做可以在网速较慢图片不能显示时让用户明白图片要传达的信息,也能让搜索引擎了解图片的内容。
2.页面质量 title信息,网页的title用于告诉用户和搜索引擎这个网页的主要内容是什么,而且当用户在百度网页搜索中搜索到你的网页时,title会作为最重要的内容显示在摘要中。搜索引擎在判断一个网页内容权重时,title是主要参考信息之一。网站描述(description)、关键词(Keywords)
五、如何查看网站被搜索引擎收录的网页
1. 使用site指令,即在搜索栏输入site:你的域名,查看网站收录情况
2.百度站长平台索引量查看收录情况
六、搜索引擎排序功能
当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法——通常根据网页中关键词的匹配程度,出现的位置、频次,链接质量等——计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。
每一个SEOer都应该认清搜索引擎优化的最根本目的就是为了获得用户,因此用户体验不能够忽视。我们在搜索引擎上获得排名的原因也是因为我们为用户提供了有价值的内容。因此,在发展方向上,无论是站长还是专业的SEOer,都应该朝着做用户、做产品、做服务的方面去发展,而不应该局限于SEO,此点甚为重要。
文章末尾固定信息
来自外部的引用