学习SEO避免蜘蛛陷阱,提升网站排名有哪些建议?
- 内容介绍
- 相关推荐
先聊聊啥叫蜘蛛陷阱
说实话,蜘蛛陷阱听起来有点吓人,像是电影里的那种暗道,内卷。。
你我共勉。 其实它就是站长们不小心给搜索引擎的爬虫埋的坑。
你想啊,爬虫跟咱们逛街一样,路不好走,它就不想进来。
后来啊网站流量掉,排名降,那可真是闹心。
常见的几大陷阱,别让它们偷跑
第一个——过多的Flash。
一言难尽。 Flash看着炫酷,可是爬虫抓不住里面的文字。
我比较认同... 你要是把首页全弄成Flash,那蜘蛛根本找不到内容。
哈哈,这种时候我都想说“不对不对,应该用HTML5来搞”。
第二个——冗长的动态URL。
URL里一堆参数、等号、问号,看得人眼花,你说它也一样,出道即巅峰。。
蜘蛛看到这种“密集恐惧”,直接绕路去别的页面。
第三个——乱七八糟的跳转。
JS跳转、Meta刷新、302跳……这些都不是好朋友。
唯一被搜索引擎认可的是301,它能把权重顺利搬家。
框架结构也是老古董
框架结构曾经风靡,现在算是技术负债了。
主要原因是内容被层层包裹,爬虫抓取时得费劲巴拉。
至于吗? 所以老网站如果还在用框架,赶紧改吧,别等到被降权才后悔。
别忘了robots.txt的小技巧
很多站长一看robots.txt,就随手写上“Disallow: /”,那必须的!。
这可是直接告诉蜘蛛:“别来”。
原来如此。 当然如果你只是想屏蔽后台管理页面那就精准点写路径。
为什么百度不收录?这事儿怎么破?
功力不足。 先说原因吧,大多数情况下是主要原因是页面质量低、内容重复或技术问题。
比如页面加载太慢、没有有效的title和meta描述,这些都会让百度打哑巴嗓子,我持保留意见...。
复盘一下。 还有就是前面说的那些蜘蛛陷阱,一旦踩进去,百度根本找不到你的宝贝内容。
解决办法很简单:检查日志, 看爬虫有没有请求到页面;优化速度;确保重要信息在HTML中而不是图片或Flash里;再说说把robots.txt和sitemap.xml调好,让百度知道该去哪儿抓取,毕竟.…。
A/B测试:不要盲目追求华丽
A/B测试本来是提升转化率的好帮手, 但如果每次改动都加了大量JS特效,那爬虫就会抱怨:“我看不懂”,研究研究。。
所以改动前先想想:这段代码对SEO有没有负面影响?如果有,就先放一放,再决定要不要上线,我直接好家伙。。
实战小技巧,让蜘蛛爱上你的站点
- 内容要原创。抄来的东西虽然省事,但搜索引擎会直接甩开门不收录。 - 合理使用H标签,把结构层次分明地写出来。 - 图片加上alt属性,即使图片加载失败,文字信息还能被识别。 - 页面加载时间控制在三秒以内,否则用户和爬虫都会跑掉。 - 内链布局要自然不要一次性塞满关键词,否则会被判为作弊。 - 定期检查死链,用工具扫一遍,把404页面换成友好的提示页或者301跳转到相关内容。 - 移动端适配必须做好, 现在大多数流量都是手机来你的网站如果在手机上卡顿,那排名肯定受影响。 - 再说说 一定记得提交最新的sitemap给搜索引擎,这一步省时又省力,让爬虫知道哪里有新鲜内容。
再聊聊常见误区,你可能也踩过
误区一:以为关键词堆砌就能上榜。
哈哈,其实搜索引擎早就把这个玩意儿当成垃圾邮件了,也是没谁了...。
现在更看重语义相关性和用户体验,你写文章的时候多站在读者角度思考吧。
误区二:把所有链接都设成nofollow,以为这样可以防止权重泄露。
Nope!关键链接还是需要传递权重,否则整个站点会显得“孤立”。
小叮嘱——保持清洁, 不给蜘蛛添堵
Crawl Budget其实就是搜索引擎给你的网站分配的一块时间片段,太多无效页面会浪费这块宝贵资源,挖野菜。。
* 所以 把无价值的分页、标签页、搜索后来啊页用noindex标记掉,让爬虫专注于真正有价值的内容,翻旧账。。
何必呢? * 定期审视网站结构, 删除或合并重复页面让信息层级更加扁平化,这样蜘蛛走起路来更顺畅,也更容易抓到核心内容。
)
先聊聊啥叫蜘蛛陷阱
说实话,蜘蛛陷阱听起来有点吓人,像是电影里的那种暗道,内卷。。
你我共勉。 其实它就是站长们不小心给搜索引擎的爬虫埋的坑。
你想啊,爬虫跟咱们逛街一样,路不好走,它就不想进来。
后来啊网站流量掉,排名降,那可真是闹心。
常见的几大陷阱,别让它们偷跑
第一个——过多的Flash。
一言难尽。 Flash看着炫酷,可是爬虫抓不住里面的文字。
我比较认同... 你要是把首页全弄成Flash,那蜘蛛根本找不到内容。
哈哈,这种时候我都想说“不对不对,应该用HTML5来搞”。
第二个——冗长的动态URL。
URL里一堆参数、等号、问号,看得人眼花,你说它也一样,出道即巅峰。。
蜘蛛看到这种“密集恐惧”,直接绕路去别的页面。
第三个——乱七八糟的跳转。
JS跳转、Meta刷新、302跳……这些都不是好朋友。
唯一被搜索引擎认可的是301,它能把权重顺利搬家。
框架结构也是老古董
框架结构曾经风靡,现在算是技术负债了。
主要原因是内容被层层包裹,爬虫抓取时得费劲巴拉。
至于吗? 所以老网站如果还在用框架,赶紧改吧,别等到被降权才后悔。
别忘了robots.txt的小技巧
很多站长一看robots.txt,就随手写上“Disallow: /”,那必须的!。
这可是直接告诉蜘蛛:“别来”。
原来如此。 当然如果你只是想屏蔽后台管理页面那就精准点写路径。
为什么百度不收录?这事儿怎么破?
功力不足。 先说原因吧,大多数情况下是主要原因是页面质量低、内容重复或技术问题。
比如页面加载太慢、没有有效的title和meta描述,这些都会让百度打哑巴嗓子,我持保留意见...。
复盘一下。 还有就是前面说的那些蜘蛛陷阱,一旦踩进去,百度根本找不到你的宝贝内容。
解决办法很简单:检查日志, 看爬虫有没有请求到页面;优化速度;确保重要信息在HTML中而不是图片或Flash里;再说说把robots.txt和sitemap.xml调好,让百度知道该去哪儿抓取,毕竟.…。
A/B测试:不要盲目追求华丽
A/B测试本来是提升转化率的好帮手, 但如果每次改动都加了大量JS特效,那爬虫就会抱怨:“我看不懂”,研究研究。。
所以改动前先想想:这段代码对SEO有没有负面影响?如果有,就先放一放,再决定要不要上线,我直接好家伙。。
实战小技巧,让蜘蛛爱上你的站点
- 内容要原创。抄来的东西虽然省事,但搜索引擎会直接甩开门不收录。 - 合理使用H标签,把结构层次分明地写出来。 - 图片加上alt属性,即使图片加载失败,文字信息还能被识别。 - 页面加载时间控制在三秒以内,否则用户和爬虫都会跑掉。 - 内链布局要自然不要一次性塞满关键词,否则会被判为作弊。 - 定期检查死链,用工具扫一遍,把404页面换成友好的提示页或者301跳转到相关内容。 - 移动端适配必须做好, 现在大多数流量都是手机来你的网站如果在手机上卡顿,那排名肯定受影响。 - 再说说 一定记得提交最新的sitemap给搜索引擎,这一步省时又省力,让爬虫知道哪里有新鲜内容。
再聊聊常见误区,你可能也踩过
误区一:以为关键词堆砌就能上榜。
哈哈,其实搜索引擎早就把这个玩意儿当成垃圾邮件了,也是没谁了...。
现在更看重语义相关性和用户体验,你写文章的时候多站在读者角度思考吧。
误区二:把所有链接都设成nofollow,以为这样可以防止权重泄露。
Nope!关键链接还是需要传递权重,否则整个站点会显得“孤立”。
小叮嘱——保持清洁, 不给蜘蛛添堵
Crawl Budget其实就是搜索引擎给你的网站分配的一块时间片段,太多无效页面会浪费这块宝贵资源,挖野菜。。
* 所以 把无价值的分页、标签页、搜索后来啊页用noindex标记掉,让爬虫专注于真正有价值的内容,翻旧账。。
何必呢? * 定期审视网站结构, 删除或合并重复页面让信息层级更加扁平化,这样蜘蛛走起路来更顺畅,也更容易抓到核心内容。
)

