提升内容站点 GEO(生成式引擎优化)的实践清单
记录时间:2026-05-20
问题
如何提升一个基于 Nuxt 3 + Markdown 的个人内容站点的 GEO?GEO(Generative Engine Optimization)和传统 SEO 的差别在于:目标不是争 Google 第一名,而是争被 ChatGPT、Perplexity、Claude、Google AI Overviews 等 AI 引擎引用进它们生成的答案里。
立刻能改的(半小时内完工)
1. robots.txt 显式放行 AI 爬虫
默认的 User-agent: * 虽然允许所有爬虫,但显式声明更安全,避免 CDN 或平台后续默认拦截。需要显式 Allow 的爬虫:
GPTBot(OpenAI)ClaudeBot/anthropic-ai(Anthropic)PerplexityBot(Perplexity)Google-Extended(Google AI / Bard)CCBot(Common Crawl,多数模型训练数据来源)Bytespider(字节豆包/Doubao)
2. 修掉 nuxt.config.ts 的瑕疵
常见的两个坑:
- meta description 里把
iOS写成了iO之类的笔误,AI 抓到会原样吃进上下文 - 默认
siteUrl还是example.com占位域名,如果生产环境忘记设NUXT_PUBLIC_SITE_URL,sitemap 和 JSON-LD 会全部指向假域名,AI 引擎无法回链
3. 增加 llms.txt
这是 Anthropic 推动的新标准,LLM 抓站时会优先读 /llms.txt 和 /llms-full.txt 来理解站点结构。模板很短:站点简介 + 分组列出所有内容的标题和 URL。可以在 build 时基于 content/notes/*.md 自动生成。
4. 每篇文章注入 Article / BlogPosting JSON-LD
如果根目录只有 WebSite schema,文章页缺少结构化数据,AI 引擎判断"是否值得引用"会很依赖以下字段:
{
"@context": "https://schema.org",
"@type": "BlogPosting",
"headline": "...",
"author": { "@type": "Person", "name": "...", "sameAs": ["https://github.com/..."] },
"datePublished": "...",
"dateModified": "...",
"about": "...",
"citation": ["..."]
}
在 pages/notes/[slug].vue 里通过 useHead 注入文章级 JSON-LD。
内容层杠杆(GEO 的核心)
5. 结构调整为「答案在前,论证在后」
LLM 摘录答案时偏好第一段就是 TL;DR:一句话结论 + 关键数字 / 要点,然后才展开论证。把笔记开头的「问题」段改成「答案」段,原问题作为副标题或导语即可。
6. 引入 FAQPage schema
Q&A 形态的笔记非常适合加 FAQPage 结构化数据,AI Overviews 和 Perplexity 特别偏好这种格式。可以在 frontmatter 增加可选字段:
faq:
- q: "..."
a: "..."
再在渲染时同步生成 FAQPage JSON-LD。
7. E-E-A-T 信号:作者页 + 引用源
AI 引擎对 Experience / Expertise / Authoritativeness / Trustworthiness 的判断比传统 SEO 更细:
about页加作者 bio、专业背景、外链(GitHub / Twitter / 掘金等)- 笔记里引用外部资料时,显式列
## 参考资料并附原始链接 — LLM 训练时会把"会引用源"识别为高质量信号
技术与抓取
8. sitemap 加 lastmod
检查 sitemap 是否为每个 URL 输出 <lastmod>,没有的话 AI 爬虫无法判断内容新鲜度,会倾向不引用。
9. OpenGraph 完整化
文章页需要补齐:
og:titleog:descriptionog:imageog:type=articlearticle:published_timearticle:modified_time
用 useSeoMeta() 一次配齐。
10. 内部链接与 related 字段落地
把 frontmatter 里的 related 字段渲染成文章末尾的相关阅读区块,构建主题簇(topic cluster),帮助 AI 引擎建立"这个站点是 X 领域的权威"的认知。
小结
按"改动成本 / 收益"排序,建议从 1 + 2 + 3 + 4 开始(robots、修瑕疵、llms.txt、文章 JSON-LD),半小时内完工就能立刻被新爬到的 AI 引擎消化。后面 5 / 6(答案前置、FAQ schema)属于内容写作风格的调整,可以沉淀进笔记模板,让以后写的每篇笔记天然 GEO 友好。