学习robots.txt写法，轻松优化网站SEO效果？

2026-04-30 08:576阅读0评论工具资源

内容介绍
相关推荐

痛并快乐着。作为网站开发者或网站管理员，我常常在深夜的咖啡灯下思考：到底该怎么让搜索引擎更懂我的站点？答案往往藏在一个不起眼的小文件里——robots.txt。

为什么要先给蜘蛛递交一张「地图」？

每当搜索引擎的爬虫敲开我们的网站大门，它们第一眼看到的就是根目录下的。这份文件像是一个礼仪手册，告诉它们哪些房间可以随意进出，哪些必须敲门后再等批准。

网站结构若杂乱无章，蜘蛛会在无用页面里兜圈子，导致抓取预算被浪费，权重也随之稀释。恰到好处地使用Disallow/Allow指令，就能把「金矿」——高价值页面——推到搜索引擎的视线前端，说到点子上了。。

情感小插曲：第一次误封首页的尴尬

记得我第一次写User-agent: * Disallow: /，不妨...

后来啊整站都被百度、谷歌打了「404」的标签，流量瞬间从千人跌到个位。那一夜，我在键盘前狂敲“撤回”，心里暗暗发誓：以后一定要先仔细检查每一行指令！于是我把这段血泪史写进了团队共享文档，提醒新同事「别把根目录关起来」。

robots.txt 基础语法速记表

核心指令
`User-agent:`	指定哪家搜索引擎适用本规则。
`Disallow:`	禁止爬取后面的路径。
`Allow:`	在全局禁止后对特定子路径开放。
`Sitemap:`	声明站点地图地址，让蜘蛛快速定位所有可抓取URL。

⚡ 小技巧：每条指令首字母必须大写，其余全小写；冒号后必须有一个空格，否则部分搜索引擎会直接忽略，开倒车。。

ZBlog 常用模板

User-agent: *
Disallow: /ADMIN/
Disallow: /SCRIPT/
Disallow: /PLUGIN/
Disallow: /FUNCTION/
Disallow: /UPDATE/
Disallow: /UPLOAD/
Disallow: /ARTICLE-IMAGE/
Sitemap: https://example.com/sitemap.xml

这段代码几乎涵盖了 ZBlog 系统中最容易产生重复内容或平安风险的目录。若你使用的是其他 CMS，只需把对应目录改成自己的即可，太治愈了。。

何时需要动手 robots.txt

#1 新增功能或改版：URL 重写后旧链接仍然能被访问，这时候建议在/old‑path/ 前加上Noindex, Nofollow 或者直接用Sitemap: .
#2 开发阶段：.git、/node_modules、/test 等目录不该向外暴露，否则会让搜索引擎抓到源码或测试数据，引起平安警报。
#3 内容重复：.php?id=123 与 /article/123 一边存在两者都收录会导致权重分散。可以只保留伪静态路径，让原始 query 参数页被 Disallow 掉。
#4 临时封禁：.pdf、视频等大文件占用了大量爬取配额，短期内不想让它们出现在 SERP 时用 Disallow 暂时屏蔽即可。
#5 国际化站点：.cn/.jp/.en 子域名分别对应不同语言，需要分别编写对应语言的 robots 文件，以免互相抢占抓取资源。

情绪化解读：让机器人也感受到你的温度 🍃

"嗨， GoogleBot，你好！"

如果你愿意，在文件最前面加上一句友好的问候：，没法说。

# Hello Google! Thanks for visiting my site :)
User-agent: Googlebot
Allow: /
Sitemap: https://example.com/sitemap.xml

虽然这些注释不会被解析，但它们像是给机器人的小纸条，让人感觉技术背后也有温度。很多 SEO 大咖在博客里都会这样做——不只是为了好玩，更是一种对「阅读」行为的尊重，盘它...。

进阶写法：针对不同蜘蛛细分策略

Baidu专属规则示例

User-agent: Baiduspider
# 禁止抓取后台管理目录
Disallow: /admin/
# 允许抓取新闻栏目
Allow: /news/
# 告诉百度站点地图位置
Sitemap:http://example.com/baidu_sitemap.xml

Sogou与 360 搜索区别对待

Sogou 和 360 的爬虫 User‑agent 名称略有不同，如果你想对它们进行差异化控制，可以这样写：，就这样吧...

User-agent : Sogou web spider
Disallow : /private/
User-agent : YisouSpider
Disallow : /private/
Allow    : /public/
Sitemap   : https://example.com/sitemap.xml

Mozillabot 与 Bingbot 同步更新

User-agent : Mozilla/5.0 
Allow      : /
Sitemap    : https://example.com/sitemap.xml
User-agent : Mozilla/5.0 
Allow      : /
Sitemap    : https://example.com/yandex_sitemap.xml

实战检查清单：发布前请自检以下五点 ✅

.txt 必须位于根目录：/robots.txt，而不是放在子文件夹；否则搜索引擎根本找不到！.
Casing 敏感："Robots.Txt" 会被当成普通文件而非协议文件；务必全小写.
Avoid 空行和乱码：Coding 编码统一为 UTF‑8 without BOM，否则某些老旧爬虫可能解析失败.
Sitemap 必须是完整 URL："Sitemap:/smap.xml" 是错误写法，需要加协议头和域名.
# 注释要以井号开头且单独占行："# This is a comment"

案例回顾：从 0 到 10W+ 月访问的转折点

A 公司是一家做 SaaS 的创业公司。创始人在第一个版本上线后仅凭内容营销就拿到了日均 300 PV。但因为产品迭代，新增加了大量后台管理页面、API 文档以及用户上传图片的目录。后来啊 Google Search Console 报告出现了「大量重复内容」和「低质量页面」警告，试着...。

第一步： 在根目录新增 , 屏蔽 /admin/、 /api-docs/、/uploads/temp/ .
将正式发布的 sitemap 放入同一文件中，用 Sitemap:https://saas.example.com/sitemap_index.xml .
提交更新后的 robots 文件至 Google Search Console，并手动请求重新抓取重要页面。
两周后「核心关键词排名」整体提升 15 位，月访问突破十万大关！ 🎉

—— 把握细节，让 SEO 更有温度

说到底，robots.txt 写法并不是技术难题，而是一种沟通艺术。我们把自己的站点结构和业务需求浓缩成几行简短指令，让全球数十亿个爬虫明白哪些是值得阅读的章节，哪些是暂时保密的章节。这种透明度本身，就是对用户和搜索引擎的一种尊重，内卷...。

如果你正为页面收录不均、抓取预算浪费而苦恼，不妨先打开根目录检查一下这份小小的 txt 文件；再配合站长工具实时监控，你会惊喜地发现，一切竟然可以如此简单地变好。祝大家玩转 robots.txt，SEO 成绩一路飙升！ 🚀，太暖了。

为什么要先给蜘蛛递交一张「地图」？

情感小插曲：第一次误封首页的尴尬

记得我第一次写User-agent: * Disallow: /，不妨...

robots.txt 基础语法速记表

核心指令
`User-agent:`	指定哪家搜索引擎适用本规则。
`Disallow:`	禁止爬取后面的路径。
`Allow:`	在全局禁止后对特定子路径开放。
`Sitemap:`	声明站点地图地址，让蜘蛛快速定位所有可抓取URL。

⚡ 小技巧：每条指令首字母必须大写，其余全小写；冒号后必须有一个空格，否则部分搜索引擎会直接忽略，开倒车。。

ZBlog 常用模板

User-agent: *
Disallow: /ADMIN/
Disallow: /SCRIPT/
Disallow: /PLUGIN/
Disallow: /FUNCTION/
Disallow: /UPDATE/
Disallow: /UPLOAD/
Disallow: /ARTICLE-IMAGE/
Sitemap: https://example.com/sitemap.xml

这段代码几乎涵盖了 ZBlog 系统中最容易产生重复内容或平安风险的目录。若你使用的是其他 CMS，只需把对应目录改成自己的即可，太治愈了。。

何时需要动手 robots.txt

#1 新增功能或改版：URL 重写后旧链接仍然能被访问，这时候建议在/old‑path/ 前加上Noindex, Nofollow 或者直接用Sitemap: .
#2 开发阶段：.git、/node_modules、/test 等目录不该向外暴露，否则会让搜索引擎抓到源码或测试数据，引起平安警报。
#3 内容重复：.php?id=123 与 /article/123 一边存在两者都收录会导致权重分散。可以只保留伪静态路径，让原始 query 参数页被 Disallow 掉。
#4 临时封禁：.pdf、视频等大文件占用了大量爬取配额，短期内不想让它们出现在 SERP 时用 Disallow 暂时屏蔽即可。
#5 国际化站点：.cn/.jp/.en 子域名分别对应不同语言，需要分别编写对应语言的 robots 文件，以免互相抢占抓取资源。

情绪化解读：让机器人也感受到你的温度 🍃

"嗨， GoogleBot，你好！"

如果你愿意，在文件最前面加上一句友好的问候：，没法说。

# Hello Google! Thanks for visiting my site :)
User-agent: Googlebot
Allow: /
Sitemap: https://example.com/sitemap.xml

进阶写法：针对不同蜘蛛细分策略

Baidu专属规则示例

User-agent: Baiduspider
# 禁止抓取后台管理目录
Disallow: /admin/
# 允许抓取新闻栏目
Allow: /news/
# 告诉百度站点地图位置
Sitemap:http://example.com/baidu_sitemap.xml

Sogou与 360 搜索区别对待

Sogou 和 360 的爬虫 User‑agent 名称略有不同，如果你想对它们进行差异化控制，可以这样写：，就这样吧...

User-agent : Sogou web spider
Disallow : /private/
User-agent : YisouSpider
Disallow : /private/
Allow    : /public/
Sitemap   : https://example.com/sitemap.xml

Mozillabot 与 Bingbot 同步更新

User-agent : Mozilla/5.0 
Allow      : /
Sitemap    : https://example.com/sitemap.xml
User-agent : Mozilla/5.0 
Allow      : /
Sitemap    : https://example.com/yandex_sitemap.xml

实战检查清单：发布前请自检以下五点 ✅

.txt 必须位于根目录：/robots.txt，而不是放在子文件夹；否则搜索引擎根本找不到！.
Casing 敏感："Robots.Txt" 会被当成普通文件而非协议文件；务必全小写.
Avoid 空行和乱码：Coding 编码统一为 UTF‑8 without BOM，否则某些老旧爬虫可能解析失败.
Sitemap 必须是完整 URL："Sitemap:/smap.xml" 是错误写法，需要加协议头和域名.
# 注释要以井号开头且单独占行："# This is a comment"

案例回顾：从 0 到 10W+ 月访问的转折点

第一步： 在根目录新增 , 屏蔽 /admin/、 /api-docs/、/uploads/temp/ .
将正式发布的 sitemap 放入同一文件中，用 Sitemap:https://saas.example.com/sitemap_index.xml .
提交更新后的 robots 文件至 Google Search Console，并手动请求重新抓取重要页面。
两周后「核心关键词排名」整体提升 15 位，月访问突破十万大关！ 🎉

为什么要先给蜘蛛递交一张「地图」？

情感小插曲：第一次误封首页的尴尬

robots.txt 基础语法速记表

ZBlog 常用模板

何时需要动手 robots.txt

情绪化解读：让机器人也感受到你的温度 🍃

进阶写法：针对不同蜘蛛细分策略

Baidu专属规则示例

Sogou与 360 搜索区别对待

Mozillabot 与 Bingbot 同步更新

实战检查清单：发布前请自检以下五点 ✅

案例回顾：从 0 到 10W+ 月访问的转折点

—— 把握细节， 让 SEO 更有温度

相关推荐

为什么要先给蜘蛛递交一张「地图」？

情感小插曲：第一次误封首页的尴尬

robots.txt 基础语法速记表

ZBlog 常用模板

何时需要动手 robots.txt

情绪化解读：让机器人也感受到你的温度 🍃

进阶写法：针对不同蜘蛛细分策略

Baidu专属规则示例

Sogou与 360 搜索区别对待

Mozillabot 与 Bingbot 同步更新

实战检查清单：发布前请自检以下五点 ✅

案例回顾：从 0 到 10W+ 月访问的转折点

—— 把握细节， 让 SEO 更有温度

相关推荐

—— 把握细节，让 SEO 更有温度

—— 把握细节，让 SEO 更有温度