TL;DR

23家企业,满分100分,最低8分,最高60分,中位数29分。17家企业至少存在一个致命问题:JS渲染空壳、HTML无语义层级、隐藏文字触发AI判定作弊。这不是行业差异问题——从医疗到金融到教育,问题高度一致。

为什么做这个审计

2026年,豆包、DeepSeek、Kimi三家平台的月活合计突破三亿。用户在问"这个行业哪家公司靠谱",AI在回答里推荐品牌。问题在于:你的品牌在不在那个回答里?

我们接触了数十家企业后发现一个矛盾:大多数老板觉得自己有官网就行了,但实际上AI根本读不懂他们的网站。

为了搞清楚这个问题有多普遍,我们决定做一轮系统审计。

审计范围

维度 说明
企业数量 23家
行业覆盖 医疗健康、在线教育、生活服务、财经科技、人力资源、金融保险、企业服务、宠物、旅行、花卉、设计
代表企业 丁香园、好大夫、粉笔、华图、天鹅到家、下厨房、格隆汇、北森、销售易、站酷等
审计时间 2026年5月至6月
评估平台 豆包、DeepSeek、Kimi
评分维度 爬虫可读性、语义结构、引用资质、品牌信息一致性
满分 100分

总体结果

23家企业的AI搜索可见度得分:

  • 最高分:60分(仅1家)
  • 最低分:8分
  • 中位数:29分
  • 超过50分:仅4家
  • 低于30分:超过半数

这个结果意味着什么?一个品牌官网在传统浏览器里看起来漂漂亮亮,在AI爬虫眼里可能是一堆读不懂的代码,或者干脆就是一片空白。

三个致命问题

审计发现,74%的网站(17家)至少存在以下三个致命问题之一。

问题一:JavaScript渲染导致爬虫抓取空白页(12家,52%)

这类网站的典型特征:打开源码,<body>里只有一个 <div id="root"></div> 和一串 <script> 标签。所有实际内容靠前端框架运行时加载。用户在浏览器里看到的精美页面,爬虫看到的是一个空壳。

AI爬虫不会执行JavaScript。它打开你的页面,看到空壳,关闭,标记为"无内容"。

被这个问题影响的12家企业中,有估值过百亿的公司。他们的网站设计团队可能根本不知道这个问题。

问题二:HTML缺乏语义化标题层级(9家,39%)

有些网站虽然内容在HTML里,但没有 <h1>-<h6> 层级结构。页面全是 <div> 嵌套,AI无法判断哪些是核心信息、哪些是辅助信息。

这就像一本书没有目录、没有章节标题、没有加粗——AI从头翻到尾,一个字都记不住。

问题三:隐藏文字触发AI判定作弊(7家,30%)

有些网站在代码里通过 display:nonevisibility:hidden 塞入了大量关键词,意图影响搜索。这是传统SEO时代的常见手段。

但在AI搜索时代,这反而成了扣分项。大模型会检测到这些"不可见但存在于代码中"的文字,并将其标记为操纵行为——直接降低品牌可信度。

行业差异

各个行业的表现没有显著差异。一家知名医疗平台的得分和一个生活服务平台的得分差不多。一家财经科技公司的网站和一家宠物电商的网站,问题长得很像。

这说明AI搜索可见度不是一个"某些行业做得好、某些行业做得差"的问题。它是全行业的结构性问题——十年前的建站标准,面对的是2026年的AI爬虫。

传统搜索排名高 ≠ AI搜索可见度高

审计中发现一个关键现象:部分企业在百度上的排名不错,但在AI搜索中完全不可见。

这两者的逻辑不同。传统搜索关心的是:关键词密度、外链数量、域名年龄。AI搜索关心的是:爬虫能不能读到内容、语义结构是否清晰、信息是否可以被引用。

两种范式,两套规则。在旧规则里排名靠前,不代表新规则里能被看到。

做了什么验证

审计不是主观打分。我们建立了四条硬性验证标准:

  1. HTML输出检查:用 curl 模拟爬虫请求,检查返回的HTML字节数是否大于2KB
  2. 语义层级检查:用结构化爬虫检查页面是否有H1-H6层级
  3. JSON-LD检查:检查页面是否包含有效的结构化数据
  4. AI查询测试:在豆包、Kimi上搜索行业关键词,检查品牌是否出现在回答中

每条标准是可验证的"是/否",不依赖主观判断。

这不是终点

审计结果跟合作方的预期一致——不是我们特意挑了差的网站,而是这个行业整体就是这个水平。

23家企业的审计数据说明了一个事实:AI搜索可见度优化不是"锦上添花",对大多数企业来说是从零开始的基建工程。先让AI爬虫能读到你的内容,再谈被推荐。

我们会在后续发布高分企业的详细分析——那些拿到50分以上的网站做对了什么。


相关阅读