跳转到主要内容

评分引擎

5.1 站点分类

评分之前,OTR会先将每个站点归入三种类别之一。分类决定了使用哪套权重公式和信号集。

三种站点类别

类别描述评分方式
ecommerce在线零售、商品销售、市场平台COLD电商权重
saas软件即服务、云平台、开发者工具COLD SaaS权重
non_commerce非商业站点(政府、非营利、媒体、教育)不评分(分数=0,徽章=UNRATED)

分类机制

分类使用多信号置信度系统,不会因单一信号就触发分类。系统会计算商业意图分数
信号分数条件
电商平台4检测到Shopify、WooCommerce、Magento等
支付处理器3检测到Stripe、PayPal、Square等
产品结构化数据3发现Schema.org Product标记
购物车/结账URL2存在/cart、/checkout、/basket等URL模式
定价页面2存在/pricing页面且有付费层级
商业链接2存在/shop、/store、/products等URL模式
SaaS信号2-4登录注册、API文档、控制台、状态页、变更日志、集成(需3个以上)
软件结构化数据1Schema.org SoftwareApplication标记
在线客服1检测到在线客服控件
预约系统1检测到预约/预订系统
会员积分1检测到会员忠诚度计划
基础阈值为4分。站点必须积累足够的信号才能越过此阈值。

排除因子

某些站点特征会提高阈值,使其更难被归类为商业站点:
因子阈值提升条件
政府域名+2.gov、.edu、.mil、.int域名
金融行业+4Wikidata金融行业分类
捐赠/筹款+4检测到筹款平台
新闻/媒体+3Wikidata媒体行业分类
非营利/公共实体+3Wikidata非营利组织分类
例如,一个.gov域名需要商业意图分数达到6分以上(4基础+2排除)才能被归类为商业站点。

电商与SaaS子类型判定

一旦站点通过商业阈值,系统使用双分数竞争机制判定电商还是SaaS: 电商分数信号: 平台指纹(+35)、产品结构化数据(+25)、购物车URL(+20)、商业链接(+10)、Wikidata零售QID(+25)、零售标签匹配(+20) SaaS分数信号: SoftwareApplication结构化数据(+30)、定价页+付费层级(+25)、SaaS HTML信号(按数量+10/+20/+25)、Wikidata软件标签(+15)、Wikidata SaaS描述(+10) 判定规则:
  1. 电商分数 ≥ 20 且 电商分数 > SaaS分数 → ecommerce
  2. SaaS分数 ≥ 20 且 SaaS分数 > 电商分数 → saas
  3. 双方均低于20,但检测到支付处理器且无产品信号 → saas(有支付但无商品表明是订阅计费)
  4. 双方均低于20,无特殊条件 → ecommerce(保守默认)
最低阈值20防止单一信号误判。一个站点需要至少两个强信号才能被确定分类。

置信度与自修正

如果分类置信度低于30%,域名会被标记为待审核。后续定期重扫描获取更多数据(Wikidata、GLEIF)后,系统可自动修正分类。

5.2 三种评分模式

OTR使用三种评分模式,每种有不同的权重公式:

COLD电商模式(电商站点默认)

Trust Score = V × 0.40 + S × 0.15 + G × 0.20 + T × 0.10 + D × 0.15
维度权重评估内容
V — 身份验证40%身份验证(SSL、GLEIF、Wikidata、域名年龄)
G — 治理合规20%商业资质(法律实体、政策、合规)
S — 运营安全15%站点安全(DNSSEC、DMARC、SPF、安全头)
D — 数据质量15%结构化数据(Schema.org、llms.txt、产品数据)
T — 信息透明10%政策透明度(隐私政策、条款、退款政策)
F — 履约与行为0%COLD模式不使用(需商家授权)
V维度权重40%,因为身份验证是信任的基石。这遵循金融行业的KYC(了解你的客户)原则:先确认身份,再评估其他。

COLD SaaS模式(SaaS/软件站点)

Trust Score = V × 0.37 + S × 0.20 + G × 0.23 + T × 0.15 + D × 0.05
维度权重与电商的区别
V — 身份验证37%略低(SaaS产品身份通常较明确)
G — 治理合规23%更高(B2B软件的合规性更重要)
S — 运营安全20%更高(安全是SaaS信任的核心)
T — 信息透明15%更高(SLA、正常运行时间、变更日志是预期标准)
D — 数据质量5%权重低,但使用专用SaaS D信号集
F — 履约与行为0%COLD模式不使用
SaaS权重为何不同: SaaS产品没有实体商品、购物车或物流,因此安全态势(S)和治理合规(G)权重更高。D维度使用完全不同的信号集(见5.5节),关注API文档、SLA承诺和开发者生态。

AUTH授权模式(已授权商家)

Trust Score = V × 0.10 + S × 0.10 + G × 0.10 + T × 0.05 + D × 0.25 + F × 0.40
维度权重与COLD的区别
V — 身份验证10%大幅降低(商家身份已验证)
S — 运营安全10%基线检查
G — 治理合规10%基线检查
T — 信息透明5%最低权重
D — 数据质量25%更高(商家提供更丰富的数据)
F — 履约与行为40%主导因素(实际交易表现)
AUTH模式在数据库中is_merchant_authorized = true时激活,即商家完成OTR授权流程后。 F维度为何主导AUTH模式: 商家身份已验证并授权后,最重要的信号是实际履约表现。发货记录、退款率、客户投诉率、响应时间成为主要信任指标。 OTR-ID格式反映模式:COLD模式前缀C,AUTH模式前缀A

5.3 非商业站点

被归类为 non_commerce 的站点不参与评分,但仍会进行身份验证:
  • 信任分数: 0
  • 徽章: UNRATED
  • OTR-ID 状态: NOT_APPLICABLE(不签发 OTR-ID)
  • 身份验证: 照常运行(GLEIF、Wikidata、SSL、Google Web Risk)
  • API 输出: 返回身份、安全和实体数据,不返回维度和信号评分
  • 前端展示: 显示”仅验证与安全信号”及检测到的身份信息
非商业站点包括政府门户、非营利组织、新闻机构和教育机构。它们会被验证身份和安全性,但不参与商业信任评分。 如果非商业站点后续被重新分类为商业站点(例如增加了产品目录),将重新进入评分管道并可获得新的 OTR-ID。

停靠域名

被检测为停靠或出售状态的域名:
  • 站点状态: PARKED
  • 信任分数: 0,不执行 backfill 或评分
  • 检测方式: 15+ 域名注册商模式匹配(GoDaddy、Sedo、Afternic、Dan.com、Namecheap、Porkbun 等)+ 指纹分析
  • 前端展示: 显示”停靠域名”
停靠域名被排除在所有处理之外以节省资源。当停靠域名恢复活跃时,SmartRescan 会检测到变化并重新进入处理管道。

5.4 信任徽章

各维度分数(0-100)加权后得出总分(0-100)。根据总分颁发信任徽章:
徽章分数范围含义
PLATINUM90-100顶级信任
GOLD80-89高度可信
SILVER70-79中等信任
BRONZE60-69初级信任
UNRATED0-59信任不足(或非商业站点)

徽章对AI代理的意义

信任徽章影响AI代理的推荐决策:
  • PLATINUM/GOLD — AI代理优先推荐,在同类商品中排名靠前
  • SILVER — AI代理正常推荐
  • BRONZE — AI代理可能推荐,但会标注信任等级
  • UNRATED — AI代理可能跳过或降低推荐优先级

5.5 SaaS D维度:16个专用信号

当站点被归类为saas时,D(数据质量)维度使用与电商完全不同的信号集。SaaS的D维度不衡量产品数据质量,而是衡量基础设施成熟度,共5个子维度16个信号,总分上限100。

D1. API文档(满分25)

信号分值条件
OpenAPI/Swagger规范+10检测到OpenAPI或Swagger规范
API端点数量+3/+5/+8≥3个端点: +3,≥10个: +5,≥20个: +8
认证文档+7发现API认证/鉴权文档

D2. SLA与可靠性(满分20)

信号分值条件
SLA页面+8存在专门的SLA页面
正常运行时间承诺+3/+5/+7≥99.0%: +3,≥99.5%: +5,≥99.9%: +7
状态页面+5存在statuspage.io或同等状态页

D3. 定价(满分25)

信号分值条件
定价页面+6存在专门的定价页面
付费层级数+3/+5/+71个层级: +3,≥2个: +5,≥3个: +7
可提取价格+7发现机器可读的定价数据
免费试用/免费版+5提供免费试用或免费层级

D4. 安全合规(满分15)

信号分值条件
安全认证+7检测到SOC2、ISO 27001或GDPR认证标识
安全页面+5存在/security或/trust页面
数据处理协议+3发现DPA页面或链接

D5. 开发者生态(满分15)

信号分值条件
开发者文档+6存在/docs或/developers页面
变更日志+4存在/changelog或/releases页面
SDK数量+3/+5≥1个SDK: +3,≥3个SDK: +5
总分上限:100分。 D维度满分的SaaS站点意味着具备完善的API文档、可靠的基础设施、透明的定价、安全合规和成熟的开发者生态。 电商站点的D维度使用另一套信号集,关注产品数据质量(Schema.org Product标记、结构化产品数据、llms.txt等)。

5.6 维度分数计算方式

每个维度的分数是该维度内所有信号的加权求和,归一化到0-100:
维度分数 = Σ(信号权重 × 信号值) / Σ(信号权重) × 100
其中:
  • 信号值 = 1(检测到)、0(未检测到)、或负值(惩罚信号触发)
  • 信号权重 = 每个信号在维度内的相对权重
系统共使用77个信号(V: 13个, S: 15个, G: 10个, T: 18个, D: 21个含4个惩罚信号)。

5.7 信号检测状态语义

OTR对每个信号使用四种状态:
状态含义对评分的影响
detected检测到,信号存在加分
not_found已检测,信号不存在不加分(或扣分)
not_scanned尚未扫描此信号不计入评分
fetch_failed尝试检测但失败(网络超时等)不计入评分(不惩罚)
四态设计区分了”确认不存在”和”还没检查”。域名不会因未评估的信号而被扣分。

5.8 评分生命周期

域名的信任评分不是一次计算就固定的,有完整的生命周期:

首次扫描

域名首次被扫描时:
  1. DNS扫描 — 检查所有DNS记录(DNSSEC、DMARC、SPF等)
  2. HTML扫描 — 抓取首页和关键页面,检查结构化数据、政策页面等
  3. 指纹识别 — 识别技术栈(2,438个指纹,975个OTR相关)
  4. 站点分类 — 多信号分类为ecommerce、saas或non_commerce
  5. 第三方查询 — GLEIF、Wikidata、Finnhub、SEC、WebRisk
  6. 评分计算 — 应用正确的权重公式,计算各维度分数和总分

定期重扫描

已评分域名会被定期重新扫描:
  • 时效重扫描 — 按域名优先级设定的时间间隔重扫
  • 变化检测重扫描 — 检测到域名指标变化时触发
  • 手动触发扫描 — 域名所有者可请求立即重扫

分数与分类变化

每次重扫后,如检测到信号变化,分数即时更新。分类也可能因新数据改变商业或子类型分数而变更。
变化效果
新配置DNSSECS维度提升
SSL证书过期V维度下降
添加Schema.org标记D维度提升
删除隐私政策页面T维度下降
检测到SaaS信号可能从ecommerce重分类为saas

5.9 数据源容错

OTR依赖多个第三方数据源(GLEIF、Wikidata、Finnhub、SEC、WebRisk)。当数据源临时不可用时:
  • 依赖该数据源的信号标记为not_scanned,不计入评分
  • 系统使用断路器机制:连续7次失败后暂停该数据源24小时
  • 数据源恢复后,下次重扫时自动重新采集
这确保了第三方数据源的临时故障不会导致大面积的评分波动。

5.10 自检:理解你的评分

查看域名评分时:
  • 确认你的评分模式(ecommerce、saas还是non_commerce)
  • 找出最低分的维度,那是你的提分重点
  • 检查显示not_found的信号,那是你可以改善的地方
  • 电商站点:V占40%,优先提升。D最容易提分(llms.txt + Schema.org)
  • SaaS站点:S(20%)和G(23%)权重更高。投资安全认证、合规文档和API文档可提升D
  • 被归类为non_commerce但应该是商业站点:确保你的站点有可见的商业信号(定价页、支付处理、商品列表)

下一章: REST API参考 — OTR查询API的完整技术文档