3.2避免蜘蛛陷阱_土豆_高清视频在线观看分类排行榜
作者:木木
作者:何杨
作者:何杨
作者:苗元威
站长们都信赖的交易中介平台,安全、高效、便捷。
中小企业网络营销第一平台,解决流量、转化率、品牌。
高收益、移动广告、弹窗CPM、点击CPC、包月广告。
提供公众号出售、求购、代售等交易中介以及增值服务。
增值电信业务经营许可证:苏B2-
编辑***:5
A5创业网 版权所有.
扫一扫关注最新创业资讯编辑日期:
4.2 &避免蜘蛛陷阱有一些网站设计技术对搜索引擎来说很不友好,不利于蜘蛛爬行和抓取,这些技术被称为蜘蛛陷阱。常见的应该全力避免的蜘蛛陷阱包括如下这些。4.2.1 &Flash在网页的某一小部分使用Flash增强视觉效果是很正常的,比如用Flash 做成的广告、图标等。这种小Flash和图片是一样的,只是HTML代码中的很小一部分,页面上还有其他以文字为主的内容,所以对搜索引擎抓取和收录没有影响。但是有的网站整个首页就是一个大的Flas***件,这就构成了蜘蛛陷阱。搜索引擎抓取的HTML代码只有一个连向Flas***件的链接,没有其他文字内容。读者可以参考前面例子的源代码。搜索引擎是无法读取Flas***件中的文字内容和链接的。这种整个就是一个大Flash的网站,可能视觉效果做得精彩异常,可惜搜索引擎看不到,不能索引出任何文字信息,也就无从判断相关性。有的网站喜欢在首页放一个Flash动画片头(Flash Intro),用户访问网站看完片头后被转向到真正的HTML 版本的文字网站首页。搜索引擎不能读取Flash, &一般也没办法从Flash Intro跟踪到 HTML 版本页面。近几年搜索引擎不停尝试读取Flas***件,尤其是里面的文字内容和链接,也取得了一定进展。站长可以使用SWFObject和sIFR 等技术使Flas***件更易于被搜索引擎读取。不过我的观点是,与其费劲去研究怎么让搜索引擎读取Flas***件,不如做成普通的HTML 版本的网站。如果你的网站除了Flash外;不足以展现公司实力,那么你的公司应该是世界 500强级别的,SEO 就不重要了。整个网站就是一个大Flas***件,从SEO角度来说是万万不可的。如果nash 效果是必需的,至少也需要在首页加上一个通往HTML 版本的链接。这个链接应该是在Flas***件之外的HTML代码中,搜索引擎跟踪这个链接可以抓取后面的HTML 版本页面。近两年移动设备使用大爆发,目前(2014 年 10月份),百度移动搜索量超越了PC端。而大量移动设备是不支持Flash的,如iPhone、iPad和很多安卓系统,因此建议站长们转移到HTML 5,可以放弃Flash了(这里仅指网页设计,不涉及游戏等应用)。4.2.2Session ID有些网站使用Session ID(会话ID)跟踪用户访问,每个用户访问网站时都会生成独特唯一的Session ID,加在URL中。搜索引擎蜘蛛的每一次访问也会被当成一个新的用户,URL中会加上一个不同的Session ID,这样搜索引擎蜘蛛每次来访问时所得到的同一个页面的URL将不一样,后面带着一个不一样的Session ID。这也是最常见的蜘蛛陷阱之一。搜索引擎遇到这种长长的Session ID,会尝试判断字符串是Sess,n ID还是正常参数,成功判断出Session ID 就可以去掉Session ID,收录正常URL。但也经常判断不出来,要么不愿意收录,要么收录多个带有不同Session ID的URL,内容却完全一样,形成大量复制内容,这两种情况对网站优化都不利,通常建议跟踪用户访问应该使用cookies而不要生成Session ID。或者程序判断访问者是搜索引擎蜘蛛还是普通用户,如果是搜索引蜘蛛,则不生成Session ID。跟踪搜索引擎蜘蛛访问是没什么意义的,蜘蛛既不会填表,也不会把商品放入购物车。4.2.3 &各种跳转除了后面会介绍的301 转向以外,搜索引擎对其他形式的跳转都比较敏感,如302跳转、JavaScript跳转、Flash跳转、Meta Refresh跳转。有些网站用户访问首页时会被自动转向到某个目录下的页面。如果是按用户地理置转向至最适合的目录,那倒情有可原。但大部分这种首页转向看不出任何理由和[这样的转向能避免则避免。如果必须转向,301 转向是搜索引擎推荐的、用于网址更改的转向,可?塑页面重从旧网址转移到新网址。其他转向方式都对蜘蛛爬行不利,原因在于后面***一章所I要介绍的,黑帽SEO经常使用转向欺骗搜索引擎和用户。所以除非万不得已,尽量不罗使用301 转向以外的跳转。424 &框架结构如果作为站长的你不知道什么是框架结构( Frame),那么恭喜你,你已经避免了这个蜘蛛陷阱,根本没必要知道什么是框架结构。如果你在网站设计中还在使用框架结构,我的建议是立即取消。使用框架结构设计页面,在网站诞生初期曾经挺流行,因为对网站的页面更新维护有一定方便性。不过现在的网站已经很少使用框架了,不利于搜索引擎抓取是框架越来越不流行的重要原因之一。对搜索引擎来说,访问一个使用框架的网址所抓取的HTML &厂只包含调用其他HTML文件的代码,并不包含任何文字信息,搜索引擎根本无法判断这个网址的内容是什么。虽然蜘蛛可以跟踪框架中所调用的其他HTML文件,但是这些文件经常是不完整的页面, &比如没有导航只是正文。搜索引擎也无法判断框架中的页面内容应该属于主框架,还是属于框架调用的文件。总之,如果你的网站还在使用框架,或者你的老板要使用框架结构,唯一要记住的是,忘记使用框架这回事。和Flash -样,别浪费时间研究怎么让搜索引擎收录框架结构网站。4.2.5动态URL动态URL指的是数据库驱动的网站所生成的、带有问号、等号及参数的网址。目前搜索引擎抓取动态URL都没有任何问题,但一般来说带有过多参数的动态URL还是不利于搜索引擎蜘蛛爬行,也不利于用户 体验,应该尽量避免。后面对动态URL及其静态化还有更详细的讨论。4.2.6 JavaScript链接由于JavaScript可以制造出很多吸引人的视觉效果,有些网站喜欢使用JavaScript脚本生成导航系统。这也是比较严重的蜘蛛陷阱之一。虽然搜索引擎都在尝试解析JS脚本,不过我们不能寄希望于搜索引擎自己去克服困难,而要让搜索引擎跟踪爬行链接的工作尽量简单容易。据我观察,虽然有的搜索引擎在技术上可以获得JavaScript脚本中包含的链接,甚至可以执行脚本并跟踪链接,但对一些权重比较低的网站,搜索引擎觉得没有必要,不会费那个劲。所以网站上的链接必须使用最简单标准的HTML链接,尤其是导航系统。用CSS 做导航系统一样可以实现很多视觉效果。JavaScript链接在SEO中也有特殊用途,那就是站长不希望被收录的页面(比如没有排名意义的页面,重复内容页面等),不希望传递权重的链接,可以使用JavaScript脚本加上robots文件阻挡搜索引擎爬行。427 &要求登录有些网站内容放在需要用户登录之后才能看到的会员区域,这部分内容搜索引擎无法看到。蜘蛛不能填写用户名、密码,也不会注册。4.2.8 &强制使用Cookies有些网站为了实现某种功能,如记住用户登登录信息、跟踪用户访问路径等,强制用户使用Cookies,用户浏览器如果没有启用Cookies,页面显示不正常。搜索引擎蜘蛛就相当于一个禁用了Cookies的浏览器,强制使用Cookies只能造成搜索引擎蜘蛛无法正常访问。seo实战密码第三版-第4章网站结构优化牧羊人seo小编推荐:
如需转载,请注明文章出处和来源网址:
我要分享到: