TL;DR
23家企业,满分100分,最低8分,最高60分,中位数29分。17家企业至少存在一个致命问题:JS渲染空壳、HTML无语义层级、隐藏文字触发AI判定作弊。这不是行业差异问题——从医疗到金融到教育,问题高度一致。
为什么做这个审计
2026年,豆包、DeepSeek、Kimi三家平台的月活合计突破三亿。用户在问"这个行业哪家公司靠谱",AI在回答里推荐品牌。问题在于:你的品牌在不在那个回答里?
我们接触了数十家企业后发现一个矛盾:大多数老板觉得自己有官网就行了,但实际上AI根本读不懂他们的网站。
为了搞清楚这个问题有多普遍,我们决定做一轮系统审计。
审计范围
| 维度 | 说明 |
|---|---|
| 企业数量 | 23家 |
| 行业覆盖 | 医疗健康、在线教育、生活服务、财经科技、人力资源、金融保险、企业服务、宠物、旅行、花卉、设计 |
| 代表企业 | 丁香园、好大夫、粉笔、华图、天鹅到家、下厨房、格隆汇、北森、销售易、站酷等 |
| 审计时间 | 2026年5月至6月 |
| 评估平台 | 豆包、DeepSeek、Kimi |
| 评分维度 | 爬虫可读性、语义结构、引用资质、品牌信息一致性 |
| 满分 | 100分 |
总体结果
23家企业的AI搜索可见度得分:
- 最高分:60分(仅1家)
- 最低分:8分
- 中位数:29分
- 超过50分:仅4家
- 低于30分:超过半数
这个结果意味着什么?一个品牌官网在传统浏览器里看起来漂漂亮亮,在AI爬虫眼里可能是一堆读不懂的代码,或者干脆就是一片空白。
三个致命问题
审计发现,74%的网站(17家)至少存在以下三个致命问题之一。
问题一:JavaScript渲染导致爬虫抓取空白页(12家,52%)
这类网站的典型特征:打开源码,<body>里只有一个 <div id="root"></div> 和一串 <script> 标签。所有实际内容靠前端框架运行时加载。用户在浏览器里看到的精美页面,爬虫看到的是一个空壳。
AI爬虫不会执行JavaScript。它打开你的页面,看到空壳,关闭,标记为"无内容"。
被这个问题影响的12家企业中,有估值过百亿的公司。他们的网站设计团队可能根本不知道这个问题。
问题二:HTML缺乏语义化标题层级(9家,39%)
有些网站虽然内容在HTML里,但没有 <h1>-<h6> 层级结构。页面全是 <div> 嵌套,AI无法判断哪些是核心信息、哪些是辅助信息。
这就像一本书没有目录、没有章节标题、没有加粗——AI从头翻到尾,一个字都记不住。
问题三:隐藏文字触发AI判定作弊(7家,30%)
有些网站在代码里通过 display:none 或 visibility:hidden 塞入了大量关键词,意图影响搜索。这是传统SEO时代的常见手段。
但在AI搜索时代,这反而成了扣分项。大模型会检测到这些"不可见但存在于代码中"的文字,并将其标记为操纵行为——直接降低品牌可信度。
行业差异
各个行业的表现没有显著差异。一家知名医疗平台的得分和一个生活服务平台的得分差不多。一家财经科技公司的网站和一家宠物电商的网站,问题长得很像。
这说明AI搜索可见度不是一个"某些行业做得好、某些行业做得差"的问题。它是全行业的结构性问题——十年前的建站标准,面对的是2026年的AI爬虫。
传统搜索排名高 ≠ AI搜索可见度高
审计中发现一个关键现象:部分企业在百度上的排名不错,但在AI搜索中完全不可见。
这两者的逻辑不同。传统搜索关心的是:关键词密度、外链数量、域名年龄。AI搜索关心的是:爬虫能不能读到内容、语义结构是否清晰、信息是否可以被引用。
两种范式,两套规则。在旧规则里排名靠前,不代表新规则里能被看到。
做了什么验证
审计不是主观打分。我们建立了四条硬性验证标准:
- HTML输出检查:用
curl模拟爬虫请求,检查返回的HTML字节数是否大于2KB - 语义层级检查:用结构化爬虫检查页面是否有H1-H6层级
- JSON-LD检查:检查页面是否包含有效的结构化数据
- AI查询测试:在豆包、Kimi上搜索行业关键词,检查品牌是否出现在回答中
每条标准是可验证的"是/否",不依赖主观判断。
这不是终点
审计结果跟合作方的预期一致——不是我们特意挑了差的网站,而是这个行业整体就是这个水平。
23家企业的审计数据说明了一个事实:AI搜索可见度优化不是"锦上添花",对大多数企业来说是从零开始的基建工程。先让AI爬虫能读到你的内容,再谈被推荐。
我们会在后续发布高分企业的详细分析——那些拿到50分以上的网站做对了什么。
相关阅读