搜索引擎抓取排名的流程有四点,
第一、抓取 (抓取规则、抓取内容、影响抓取因素、什么东西来抓取)
第二、过滤 (为什么过滤、过滤好的网页到哪里)
第三、索引 (什么样的页面会索引)
第四、排名 (怎么知道有排名、哪些会影响排名)
一、抓取
1.抓取规则:深度抓取、广度抓取
深度抓取:从 首页→栏目→文章 (垂直而下)
优点:适合直接搜索、网站里面搜索
缺点:蜘蛛爬行页面内容比较深的站点的时候比较浪费时间和资源
影响抓取因素:仅图片、链接、视频、iframe框架、js、CSS 会影响抓取
需要注意蜘蛛不能识别内容:页面里的图片、flash制作的网页、iframe框架(百度地图类似)、参数、标点符号、CSS、js、需要登录账号的网页、 蜘蛛是抓不到的
Iframe框架、文字、图片、视频旁边或者标题需要文字说明
广度抓取:从 首页→栏目1→栏目2(横扫千军)
优点:能减少蜘蛛爬行的深度,免得遇到一个很深的分支时,蜘蛛会一直爬,不要蜘蛛跑过头了
缺点:要想爬到文章较深处,比较耗时间
二、过虑
1.为什么要过虑?
因为互联网上有非常多的垃圾网站和有用的信息,如果不分类处理的话,很多垃圾的没用的信息会被用户看到,浪费用户的时间和精力在没用的信息上。
也节省搜索引擎的工作时间和效率。
2.过滤好的网页到哪里?
过虑好的网页放在临时数据库里面。
三、索引
1.什么样的页面会索引?
网页内容质量好的页面会展现在用户面前。(用户点击的多,时间停留长,为用户带来价值)
四、排名
1.怎么知道有排名?
在搜索框输入:site:域名方式查看
2.哪些会影响排名?
网站定位
网站结构
网站布局
网站代码
网站内容
网站忠诚度
外链推广
最新评论