当我们建立Semlo时,我们有一个目标:让店主们很容易看到ChatGPT是否能找到他们。

然后团队中有人问了显而易见的问题:"我们自己跑过吗?"

我们没有。所以我们做了。

当我们审计Semlo时Semlo发现了什么

分数低于我们的预期。这正是被标记的:

AI机器人没有被明确欢迎。我们的robots.txt没有具体提到GPTBot、ClaudeBot或PerplexityBot。他们没有被阻止——但对于AI可见性,明确比隐含更好。如果你没有告诉AI爬虫它受欢迎,它可能会降低你的网站的优先级。

我们没有llms.txt。这有点疼。llms.txt是一个简单的文本文件,告诉AI引擎你的网站是什么——它是给谁的,它做什么,在哪里找到重要页面。我们检查每次我们运行的审计。我们自己没有。

我们的schema标记丢失了。我们没有结构化数据描述什么是Semlo、谁是它、或它的价格是多少。AI引擎在决定是否推荐产品时使用这些信息。没有它,他们从纯文本猜测。

我们的URL结构增加了不必要的复杂性。Semlo上的每一页都住在像/us/en/pricing这样的路径下,而不是/pricing。更长的带有地区前缀的URL对爬虫更难解析,对用户也更难共享。

Semlo分数实际上测量什么

Semlo基于四样东西给每家店铺0到100的分数:

  • AI访问 (40%) ——AI机器人能访问你的网站吗?
  • 技术信号 (25%) ——schema标记、网站地图、服务器端渲染
  • 内容信号 (20%) ——标题、常见问题内容、定义、页面质量
  • 社会存在 (15%) ——你有多少个活跃频道

当我们对自己运行审计时,我们在AI访问检查上失败(没有明确的机器人权限),技术检查上(没有schema),并且没有llms.txt。我们的分数反映了它。

我们修复了什么——以及花了多长时间

我们在一个周末内修复了一切。

robots.txt ——我们为GPTBot、ClaudeBot、OAI-SearchBot、PerplexityBot和另外三个添加了明确的Allow指令。十分钟。

llms.txt ——我们写了一个纯文本描述什么是Semlo、谁是它、以及在哪里找到关键页面。三十分钟。

Schema标记 ——我们向我们的主页添加了Organization、WebSite、SoftwareApplication和FAQPage schemas。FAQPage schema单独意味着Google和AI引擎现在可以将我们的常见问题部分作为结构化问答数据读取。一小时。

URL结构 ——我们进行了重组,以便英文内容存在于根目录(semlo.io/pricing,而不是semlo.io/us/en/pricing)。我们从旧URL添加了301重定向,所以没有东西断掉。半天包括测试。

一旦我们知道怎样做,都不需要开发人员。这就是重点。

为什么我们发布这个

因为如果我们在我们自己的网站上错过了这些东西——一个网站专门为了检查这些东西——店主几乎肯定也在错过他们。

而且他们没有理由知道要找什么。这不是批评。直到最近,这些东西都不存在。AI搜索是新的。最佳实践仍在被写出来。

Semlo的存在是为了让这对经营店铺的人来说是可以理解的,而不是对经营基础设施的人。

检查你的店

我们现在每周在自己身上运行Semlo审计。如果任何东西下降,我们在下个周一之前修复它。

如果你还没有检查你的店,从那里开始。审计是免费的,花15秒。