评分引擎
5.1 站点分类
评分之前,OTR会先将每个站点归入三种类别之一。分类决定了使用哪套权重公式和信号集。三种站点类别
| 类别 | 描述 | 评分方式 |
|---|---|---|
| ecommerce | 在线零售、商品销售、市场平台 | COLD电商权重 |
| saas | 软件即服务、云平台、开发者工具 | COLD SaaS权重 |
| non_commerce | 非商业站点(政府、非营利、媒体、教育) | 不评分(分数=0,徽章=UNRATED) |
分类机制
分类使用多信号置信度系统,不会因单一信号就触发分类。系统会计算商业意图分数:| 信号 | 分数 | 条件 |
|---|---|---|
| 电商平台 | 4 | 检测到Shopify、WooCommerce、Magento等 |
| 支付处理器 | 3 | 检测到Stripe、PayPal、Square等 |
| 产品结构化数据 | 3 | 发现Schema.org Product标记 |
| 购物车/结账URL | 2 | 存在/cart、/checkout、/basket等URL模式 |
| 定价页面 | 2 | 存在/pricing页面且有付费层级 |
| 商业链接 | 2 | 存在/shop、/store、/products等URL模式 |
| SaaS信号 | 2-4 | 登录注册、API文档、控制台、状态页、变更日志、集成(需3个以上) |
| 软件结构化数据 | 1 | Schema.org SoftwareApplication标记 |
| 在线客服 | 1 | 检测到在线客服控件 |
| 预约系统 | 1 | 检测到预约/预订系统 |
| 会员积分 | 1 | 检测到会员忠诚度计划 |
排除因子
某些站点特征会提高阈值,使其更难被归类为商业站点:| 因子 | 阈值提升 | 条件 |
|---|---|---|
| 政府域名 | +2 | .gov、.edu、.mil、.int域名 |
| 金融行业 | +4 | Wikidata金融行业分类 |
| 捐赠/筹款 | +4 | 检测到筹款平台 |
| 新闻/媒体 | +3 | Wikidata媒体行业分类 |
| 非营利/公共实体 | +3 | Wikidata非营利组织分类 |
电商与SaaS子类型判定
一旦站点通过商业阈值,系统使用双分数竞争机制判定电商还是SaaS: 电商分数信号: 平台指纹(+35)、产品结构化数据(+25)、购物车URL(+20)、商业链接(+10)、Wikidata零售QID(+25)、零售标签匹配(+20) SaaS分数信号: SoftwareApplication结构化数据(+30)、定价页+付费层级(+25)、SaaS HTML信号(按数量+10/+20/+25)、Wikidata软件标签(+15)、Wikidata SaaS描述(+10) 判定规则:- 电商分数 ≥ 20 且 电商分数 > SaaS分数 → ecommerce
- SaaS分数 ≥ 20 且 SaaS分数 > 电商分数 → saas
- 双方均低于20,但检测到支付处理器且无产品信号 → saas(有支付但无商品表明是订阅计费)
- 双方均低于20,无特殊条件 → ecommerce(保守默认)
置信度与自修正
如果分类置信度低于30%,域名会被标记为待审核。后续定期重扫描获取更多数据(Wikidata、GLEIF)后,系统可自动修正分类。5.2 三种评分模式
OTR使用三种评分模式,每种有不同的权重公式:COLD电商模式(电商站点默认)
| 维度 | 权重 | 评估内容 |
|---|---|---|
| V — 身份验证 | 40% | 身份验证(SSL、GLEIF、Wikidata、域名年龄) |
| G — 治理合规 | 20% | 商业资质(法律实体、政策、合规) |
| S — 运营安全 | 15% | 站点安全(DNSSEC、DMARC、SPF、安全头) |
| D — 数据质量 | 15% | 结构化数据(Schema.org、llms.txt、产品数据) |
| T — 信息透明 | 10% | 政策透明度(隐私政策、条款、退款政策) |
| F — 履约与行为 | 0% | COLD模式不使用(需商家授权) |
COLD SaaS模式(SaaS/软件站点)
| 维度 | 权重 | 与电商的区别 |
|---|---|---|
| V — 身份验证 | 37% | 略低(SaaS产品身份通常较明确) |
| G — 治理合规 | 23% | 更高(B2B软件的合规性更重要) |
| S — 运营安全 | 20% | 更高(安全是SaaS信任的核心) |
| T — 信息透明 | 15% | 更高(SLA、正常运行时间、变更日志是预期标准) |
| D — 数据质量 | 5% | 权重低,但使用专用SaaS D信号集 |
| F — 履约与行为 | 0% | COLD模式不使用 |
AUTH授权模式(已授权商家)
| 维度 | 权重 | 与COLD的区别 |
|---|---|---|
| V — 身份验证 | 10% | 大幅降低(商家身份已验证) |
| S — 运营安全 | 10% | 基线检查 |
| G — 治理合规 | 10% | 基线检查 |
| T — 信息透明 | 5% | 最低权重 |
| D — 数据质量 | 25% | 更高(商家提供更丰富的数据) |
| F — 履约与行为 | 40% | 主导因素(实际交易表现) |
is_merchant_authorized = true时激活,即商家完成OTR授权流程后。
F维度为何主导AUTH模式: 商家身份已验证并授权后,最重要的信号是实际履约表现。发货记录、退款率、客户投诉率、响应时间成为主要信任指标。
OTR-ID格式反映模式:COLD模式前缀C,AUTH模式前缀A。
5.3 非商业站点
被归类为 non_commerce 的站点不参与评分,但仍会进行身份验证:- 信任分数: 0
- 徽章: UNRATED
- OTR-ID 状态: NOT_APPLICABLE(不签发 OTR-ID)
- 身份验证: 照常运行(GLEIF、Wikidata、SSL、Google Web Risk)
- API 输出: 返回身份、安全和实体数据,不返回维度和信号评分
- 前端展示: 显示”仅验证与安全信号”及检测到的身份信息
停靠域名
被检测为停靠或出售状态的域名:- 站点状态: PARKED
- 信任分数: 0,不执行 backfill 或评分
- 检测方式: 15+ 域名注册商模式匹配(GoDaddy、Sedo、Afternic、Dan.com、Namecheap、Porkbun 等)+ 指纹分析
- 前端展示: 显示”停靠域名”
5.4 信任徽章
各维度分数(0-100)加权后得出总分(0-100)。根据总分颁发信任徽章:| 徽章 | 分数范围 | 含义 |
|---|---|---|
| PLATINUM | 90-100 | 顶级信任 |
| GOLD | 80-89 | 高度可信 |
| SILVER | 70-79 | 中等信任 |
| BRONZE | 60-69 | 初级信任 |
| UNRATED | 0-59 | 信任不足(或非商业站点) |
徽章对AI代理的意义
信任徽章影响AI代理的推荐决策:- PLATINUM/GOLD — AI代理优先推荐,在同类商品中排名靠前
- SILVER — AI代理正常推荐
- BRONZE — AI代理可能推荐,但会标注信任等级
- UNRATED — AI代理可能跳过或降低推荐优先级
5.5 SaaS D维度:16个专用信号
当站点被归类为saas时,D(数据质量)维度使用与电商完全不同的信号集。SaaS的D维度不衡量产品数据质量,而是衡量基础设施成熟度,共5个子维度16个信号,总分上限100。D1. API文档(满分25)
| 信号 | 分值 | 条件 |
|---|---|---|
| OpenAPI/Swagger规范 | +10 | 检测到OpenAPI或Swagger规范 |
| API端点数量 | +3/+5/+8 | ≥3个端点: +3,≥10个: +5,≥20个: +8 |
| 认证文档 | +7 | 发现API认证/鉴权文档 |
D2. SLA与可靠性(满分20)
| 信号 | 分值 | 条件 |
|---|---|---|
| SLA页面 | +8 | 存在专门的SLA页面 |
| 正常运行时间承诺 | +3/+5/+7 | ≥99.0%: +3,≥99.5%: +5,≥99.9%: +7 |
| 状态页面 | +5 | 存在statuspage.io或同等状态页 |
D3. 定价(满分25)
| 信号 | 分值 | 条件 |
|---|---|---|
| 定价页面 | +6 | 存在专门的定价页面 |
| 付费层级数 | +3/+5/+7 | 1个层级: +3,≥2个: +5,≥3个: +7 |
| 可提取价格 | +7 | 发现机器可读的定价数据 |
| 免费试用/免费版 | +5 | 提供免费试用或免费层级 |
D4. 安全合规(满分15)
| 信号 | 分值 | 条件 |
|---|---|---|
| 安全认证 | +7 | 检测到SOC2、ISO 27001或GDPR认证标识 |
| 安全页面 | +5 | 存在/security或/trust页面 |
| 数据处理协议 | +3 | 发现DPA页面或链接 |
D5. 开发者生态(满分15)
| 信号 | 分值 | 条件 |
|---|---|---|
| 开发者文档 | +6 | 存在/docs或/developers页面 |
| 变更日志 | +4 | 存在/changelog或/releases页面 |
| SDK数量 | +3/+5 | ≥1个SDK: +3,≥3个SDK: +5 |
5.6 维度分数计算方式
每个维度的分数是该维度内所有信号的加权求和,归一化到0-100:信号值= 1(检测到)、0(未检测到)、或负值(惩罚信号触发)信号权重= 每个信号在维度内的相对权重
5.7 信号检测状态语义
OTR对每个信号使用四种状态:| 状态 | 含义 | 对评分的影响 |
|---|---|---|
| detected | 检测到,信号存在 | 加分 |
| not_found | 已检测,信号不存在 | 不加分(或扣分) |
| not_scanned | 尚未扫描此信号 | 不计入评分 |
| fetch_failed | 尝试检测但失败(网络超时等) | 不计入评分(不惩罚) |
5.8 评分生命周期
域名的信任评分不是一次计算就固定的,有完整的生命周期:首次扫描
域名首次被扫描时:- DNS扫描 — 检查所有DNS记录(DNSSEC、DMARC、SPF等)
- HTML扫描 — 抓取首页和关键页面,检查结构化数据、政策页面等
- 指纹识别 — 识别技术栈(2,438个指纹,975个OTR相关)
- 站点分类 — 多信号分类为ecommerce、saas或non_commerce
- 第三方查询 — GLEIF、Wikidata、Finnhub、SEC、WebRisk
- 评分计算 — 应用正确的权重公式,计算各维度分数和总分
定期重扫描
已评分域名会被定期重新扫描:- 时效重扫描 — 按域名优先级设定的时间间隔重扫
- 变化检测重扫描 — 检测到域名指标变化时触发
- 手动触发扫描 — 域名所有者可请求立即重扫
分数与分类变化
每次重扫后,如检测到信号变化,分数即时更新。分类也可能因新数据改变商业或子类型分数而变更。| 变化 | 效果 |
|---|---|
| 新配置DNSSEC | S维度提升 |
| SSL证书过期 | V维度下降 |
| 添加Schema.org标记 | D维度提升 |
| 删除隐私政策页面 | T维度下降 |
| 检测到SaaS信号 | 可能从ecommerce重分类为saas |
5.9 数据源容错
OTR依赖多个第三方数据源(GLEIF、Wikidata、Finnhub、SEC、WebRisk)。当数据源临时不可用时:- 依赖该数据源的信号标记为
not_scanned,不计入评分 - 系统使用断路器机制:连续7次失败后暂停该数据源24小时
- 数据源恢复后,下次重扫时自动重新采集
5.10 自检:理解你的评分
查看域名评分时:- 确认你的评分模式(ecommerce、saas还是non_commerce)
- 找出最低分的维度,那是你的提分重点
- 检查显示
not_found的信号,那是你可以改善的地方 - 电商站点:V占40%,优先提升。D最容易提分(llms.txt + Schema.org)
- SaaS站点:S(20%)和G(23%)权重更高。投资安全认证、合规文档和API文档可提升D
- 被归类为non_commerce但应该是商业站点:确保你的站点有可见的商业信号(定价页、支付处理、商品列表)
下一章: REST API参考 — OTR查询API的完整技术文档