G/T/D维度 — 治理、透明度与数据质量
4.1 G维度:治理 (Governance)
G维度回答一个问题:你有合法的商业资质吗?
G维度信号列表
OTR系统检查10个治理信号:
| 信号 | 检查内容 | 数据源 |
|---|
| GLEIF法律实体 | 在GLEIF注册的法律实体信息 | GLEIF API |
| LEI编号 | 是否有有效的法律实体标识符 | GLEIF API |
| LEI状态 | LEI编号是否在有效期内 | GLEIF API |
| 企业注册地 | 注册在哪个司法管辖区 | GLEIF API |
| 上市公司验证 | 股票代码和交易所信息 | Finnhub API |
| SEC备案 | 美国证券交易委员会备案信息 | SEC EDGAR |
| 母公司关系 | 母公司信息及其可信度 | GLEIF/Wikidata |
| 总部地理验证 | 公司总部位置与域名信息一致性 | 多源比对 |
| OpenFIGI金融标识 | 金融工具全球标识符 | OpenFIGI API |
| 企业类型 | 上市公司/私有公司/非营利/政府 | 综合判定 |
权重分配
G维度在OTR总分中的权重是 20%(COLD模式下)。
G维度的特点
G维度和其他维度有一个重要区别:并非所有商家都能在G维度获得高分。
LEI编号需要企业注册资质,上市公司验证只适用于上市企业,SEC备案只适用于在美上市的公司。对于小型商家来说,G维度的很多信号不适用,这是正常的。
OTR的评分系统会根据商家类型调整期望。一个小型独立站不会因为没有LEI编号而被严重扣分,但一个声称是大企业的域名如果没有任何治理信号,就会被怀疑。
提升G维度的建议
| 操作 | 适用对象 | 效果 |
|---|
| 注册LEI编号 | 中大型企业 | 显著提升 |
| 确保GLEIF信息准确 | 已注册企业 | 中等提升 |
| 上市公司确保Finnhub可查 | 上市公司 | 显著提升 |
| 保持注册信息更新 | 所有企业 | 避免因信息过期被扣分 |
4.2 T维度:透明度 (Transparency)
T维度回答一个问题:你的政策和信息是否清晰透明?
T维度信号列表
OTR系统检查18个透明度信号:
| 信号 | 检查内容 | 检测方式 |
|---|
| 隐私政策存在 | 是否有可访问的隐私政策页面 | HTML爬取 |
| 隐私政策质量 | 政策内容的完整性和清晰度 | 内容分析 |
| 退货政策存在 | 是否有退货/退款政策页面 | HTML爬取 |
| 退货政策质量 | 退货条件是否具体、可操作 | 内容分析 |
| 服务条款存在 | 是否有服务条款页面 | HTML爬取 |
| 联系邮箱 | 是否提供联系邮箱 | HTML爬取 |
| 联系电话 | 是否提供联系电话 | HTML爬取 |
| 物理地址 | 是否提供实体办公地址 | HTML爬取 |
| Schema.org Organization | 是否有机器可读的公司信息标记 | JSON-LD解析 |
| Schema.org ContactPoint | 联系方式是否结构化 | JSON-LD解析 |
| About页面 | 是否有关于我们页面 | HTML爬取 |
| 社交媒体链接 | 是否链接到官方社交账号 | HTML爬取 |
| Cookie政策 | 是否有Cookie使用声明 | HTML爬取 |
| 数据处理协议 | GDPR相关的数据处理信息 | HTML爬取 |
| 无障碍声明 | 网站无障碍性声明 | HTML爬取 |
| 投诉渠道 | 是否有明确的投诉处理流程 | HTML爬取 |
| 价格透明度 | 价格是否包含税费说明 | HTML爬取 |
| 配送信息 | 配送范围和时效说明 | HTML爬取 |
权重分配
T维度在OTR总分中的权重是 10%(COLD模式下)。
提升T维度的建议
T维度是最”民主”的维度,不需要企业资质,不需要技术知识,只需要认真写政策页面。
优先级排序:
- 隐私政策 — 必须有,内容要具体(不要用模板原文)
- 退货政策 — 写清楚退货条件、时限、流程
- 完整联系方式 — 邮箱、电话、地址(至少两项)
- Schema.org Organization标记 — 让机器也能读懂你的公司信息
- About页面 — 介绍你的公司、团队、历史
政策页面不是法律文件堆砌。AI代理会分析政策内容的质量,一份清晰、具体、用户友好的隐私政策比一份充满法律术语的模板得分更高。
4.3 D维度:数据质量 (Data Quality)
D维度回答一个问题:你的商品信息是否完整、结构化、机器可读?
D维度信号列表
OTR系统检查21个数据质量信号(含4个惩罚信号):
| 信号 | 检查内容 | 检测方式 |
|---|
| Schema.org Product存在 | 是否有Product结构化标记 | JSON-LD解析 |
| Product name字段 | 商品名是否标注 | JSON-LD解析 |
| Product description字段 | 商品描述是否标注 | JSON-LD解析 |
| Product price字段 | 价格是否标注 | JSON-LD解析 |
| Product availability字段 | 库存状态是否标注 | JSON-LD解析 |
| Product image字段 | 商品图片URL是否标注 | JSON-LD解析 |
| Product brand字段 | 品牌是否标注 | JSON-LD解析 |
| Product SKU/GTIN | 商品唯一标识是否标注 | JSON-LD解析 |
| JSON-LD格式正确性 | JSON-LD语法是否有效 | 语法解析 |
| llms.txt存在 | 是否有llms.txt文件 | HTTP请求 |
| llms.txt质量 | llms.txt内容的完整性 | 内容分析 |
| agent.json存在 | 是否有agent.json声明 | HTTP请求 |
| Sitemap存在 | 是否有XML Sitemap | HTTP请求 |
| Sitemap质量 | Sitemap是否包含商品页面 | XML解析 |
| robots.txt存在 | 是否有robots.txt | HTTP请求 |
| AI爬虫未被屏蔽 | robots.txt是否允许AI爬虫 | 规则解析 |
| 页面可抓取性 | 商品页面是否可以正常抓取 | HTTP请求 |
| 惩罚: 数据不一致 | 标记数据与页面内容矛盾 | 比对分析 |
| 惩罚: 关键字段缺失 | Product标记缺少必要字段 | 完整性检查 |
| 惩罚: 过时数据 | Sitemap lastmod与实际不符 | 时间比对 |
| 惩罚: 爬虫阻断 | 主动屏蔽AI爬虫 | robots.txt分析 |
权重分配
D维度在OTR总分中的权重是 15%(COLD模式下)。
为什么D维度是”最大的提分杠杆”
根据对全球电商域名的分析:
- 有llms.txt的域名不到5%
- 有完整Schema.org Product标记的电商站点不到30%
- 两者都有的不到3%
这意味着D维度的绝大多数信号,大多数网站都还没做。做了就领先。而且D维度的每一个信号都是免费的、零风险的、不影响现有功能的。
惩罚信号
D维度有4个惩罚信号。这些信号不是”没有就扣分”,而是”做错了扣分”:
- 数据不一致 — 标记说”有货”但页面显示”缺货”
- 关键字段缺失 — 有Product标记但缺少price或name
- 过时数据 — Sitemap说”今天更新”但内容几个月没变
- 爬虫阻断 — 在robots.txt中主动屏蔽AI爬虫
这些惩罚信号的设计目的是防止低质量的结构化数据误导AI代理。
三类站点的D维度差异
OTR系统会根据网站类型调整D维度的信号权重:
| 站点类型 | 重点信号 | 次要信号 |
|---|
| 电商站点 | Product标记、价格、库存 | llms.txt、agent.json |
| SaaS/服务站点 | llms.txt、Organization标记 | Product标记(不适用) |
| 内容/媒体站点 | Article标记、Sitemap | Product标记(不适用) |
提升D维度的实操建议
参考 Book 6 的第3-8章获取详细操作指南。
下一章: 评分引擎 — COLD模式详解 — 权重算法、徽章计算和评分生命周期