技术SEO审计清单
技术 SEO 审计是找出网站被搜索引擎正确抓取、索引和排名的障碍。建议每季度执行一次完整审计。
审计全流程
graph LR
A[准备工具] --> B[抓取分析]
B --> C[索引检查]
C --> D[速度与体验]
D --> E[站点架构]
E --> F[生成报告与修复计划]
A --> A1[Screaming Frog + GSC + Ahrefs]
B --> B1[发现爬虫错误和重定向链]
C --> C1[确认被索引页面数量正常]
E --> E1[Sitemap / robots.txt / 规范链接]
style F fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px
一、爬虫与索引审计
爬虫错误类型
| 错误类型 | 影响 | 修复方法 |
|---|---|---|
| 4xx 错误(页面不存在) | 浪费爬虫预算,丢失外链权重 | 301 重定向到相关页面或删除 |
| 5xx 错误(服务器错误) | 页面无法被索引 | 排查服务器/CDN 配置 |
| 软性 404 | 页面返回 200 但无内容 | 返回真正的 404 或修复内容 |
| 重定向链(多跳) | 降低爬虫效率,损耗权重 | 合并为单次直接 301 重定向 |
| 重定向循环 | 页面完全无法访问 | 立即修复,优先级最高 |
二、重复内容审计
重复内容是常被忽视的技术问题:
graph TD
DUP[重复内容来源] --> URL[URL参数导致的重复]
DUP --> CANONICAL[缺少规范链接标签]
DUP --> WWW[www与非www版本并存]
DUP --> HTTP[HTTP与HTTPS版本并存]
DUP --> TRAIL[有/无末尾斜线并存]
URL --> FIX1[在GSC配置URL参数]
CANONICAL --> FIX2[添加 rel=canonical 标签]
WWW --> FIX3[301重定向到首选版本]
HTTP --> FIX4[强制HTTPS并更新内部链接]
TRAIL --> FIX5[统一末尾斜线规则]
style DUP fill:#ffebee,stroke:#c62828,stroke-width:2px
style FIX2 fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px
三、Sitemap 审计
XML Sitemap 的正确配置要求:
- 只包含可索引的页面(不要包含 noindex 页面)
- 只包含规范版本的 URL(与 canonical 标签一致)
- 文件大小不超过 50MB,URL 数量不超过 50,000 条
- 已在 Google Search Console 提交并无报错
lastmod日期真实反映内容更新时间(不要虚报日期)
四、robots.txt 审计
| 检查项 | 正常状态 | 常见问题 |
|---|---|---|
| 文件可访问性 | domain.com/robots.txt 返回 200 | 返回 404 导致爬虫混乱 |
| 是否误屏蔽重要目录 | 核心内容目录未被 Disallow | Disallow: / 屏蔽全站 |
| Sitemap 是否已声明 | Sitemap: https://...sitemap.xml | 未声明导致发现延迟 |
| User-agent 规则 | 针对 Googlebot 有明确规则 | 规则顺序错误导致覆盖 |
五、完整审计清单
爬虫与索引
- [ ] 用 Screaming Frog 全站抓取,导出所有 4xx/5xx 页面
- [ ] 检查 Google Search Console → 覆盖率报告,查看排除/无效页面
- [ ] 确认被索引页面数量与实际页面数量接近(
site:domain.com) - [ ] 检查是否存在多跳重定向链(> 2 跳应合并)
重复内容
- [ ] 每个页面是否有且仅有一个
<link rel="canonical">标签 - [ ] www/非www 是否统一并有 301 重定向
- [ ] HTTP 是否全部强制跳转 HTTPS
站点架构
- [ ] XML Sitemap 已提交 GSC 且状态正常
- [ ] robots.txt 未误封重要内容,已声明 Sitemap 路径
- [ ] 内部链接是否存在断链(Screaming Frog → Response Codes → 4xx)
- [ ] 孤立页面(无任何内链指向)是否已处理
结构化数据
- [ ] 用 Google Rich Results Test 验证主要页面的 Schema 标记
- [ ] 检查 GSC → 增强功能,查看结构化数据错误报告
下一章: Onpage优化 — 标题与内链架构