一、目背景
我一大型新站,旗下包含十多容分站(、、、育、健康、生活等)。每篇文章底部展示 20 篇相推文章,是站流量循的重要入口。
目前相推由套系行出:
- 新系:我自建的推算法,在 Google BigQuery 上行,有:
- 基於命名重的推:比文章共同提到的人名、地名、事件等判相性
- 基於向量搜索的推:利用文章 Embedding 算相似度,合度排序
- 系:原有推系,目前作效果比的基
核心目:在所有分站上,新系的推效果必超越系。 目前多分站已先,但仍有分站落後,需要在 4 通系性的迭代解。
二、概述
根最新,各分站的新系 CTR (率)比情如下:
- 一些分站明落後:新系 CTR 低於系 10%~35%,是本次化的重
- 一些分站基本持平:新系小幅先,但不明,需固
- 多分站已大幅出:新系先幅度在 13%~73% 之,以定主
- 少量小站不入化:文章量少,投入出比低
三、分析
落後分站的共同特是 容的效性需求和推算法的衰策略不匹配:
- (差距最大):者找特定的深度,典文章依然有值。但算法偏好新文,把有值的「文」到了很低的推分。
- 知考(如健康):容具有期考值,不像新有明的效性。衰排除容。
- :曾出但近期退步,可能近期的整有,需要排查。
相比之下,已出的分站(育、政治、等)恰好是「效性」的容,算法偏好新文章的策略在些景下正好契合用需求。
四、技
件 技 Google BigQuery 推算法 BigQuery SQL Stored Procedures 向量搜索 BigQuery VECTOR_SEARCH 推出 GCS (Google Cloud Storage) 版本管理 Git
五、化方法
5.1 三估漏斗
每次整不再直接上等果,而是通三漏斗逐步:
第一:估(分) 用史回,快速掉明差的配置 入 20+ 配置 → 到 8 ↓ 第二:Interleaving (小) 在同一推列表中交混合配置的果 用偏好哪 敏度是 A/B 的 10-100 倍 8 → 到 2-3 ↓ 第三:A/B (天) 最候做分流 察期指(停留、推路深度) 2-3 → 最
5.2 多因素
同多的不同合,而非一次只改一。需要整的包括:
- 衰策略:文章年推分的影程度
- / 重:不同相似度信在分中的比重
- 度重:推度的加分幅度
- 候池窗口:多取候文章
- 新信:如同加分、典容保留位等
通正交,少量即可覆主要的因素交互效。
5.3 合量指
不看 CTR ,要看用後的行量:
- CTR:推被的概率
- 推路深度( Session Depth ):用了推後,是否下一篇推
- 停留( Dwell Proxy ):用在推文章上的停留
多指可以避免「吸引人但容不匹配」的情。
六、2 排程
段 主要工作 出 Week 0 ( 1 天) 基施
建估集、合指追、Interleaving 框架、配置表 估工具就 Week 0 ( 2 天) Round 1:探索 多配置全 → 上 Interleaving → A/B 最基配置 Week 0 ( 2 天) Round 2:新信 在最配置上新信(加分、典容位等) 各分站最信合 Week 1 ( 3 天) Round 3:精 + 混合策略,72 小定性 各分站最配置 Week 1 ( 2 天) 生部署 + 控 上最配置,部署每日控和告警制 系上、控就
七、交付
必成
- 所有入化的分站,新系 CTR ≥ 系 CTR 20%
- 已出分站不退步 持有先 同要求
- 建立持控制 每日健康度表、常告警
- 每有完整 配置、、、策依可追溯
八、所需技能
技能要求:
SQL / BigQuery 熟。核心工作是修改和 BigQuery Stored Procedures 推系 了解基本概念( CTR 、A/B 、Interleaving 、推排序) 分析 能、分析果、判著性 Git 基本使用即可 Python
非必,但如需做理有助
九、工作方式
- 每束後,需提交告(配置、果、策)
- 重大改需先通再上
- 每日同步展,有阻塞及反
- 代通 Git 管理
十、其他
- 如果您有相关经验,欢迎带着报价来投。未来希望能达成长久合作
- 也希望您是自由工作者或者有大量的业余时间,以利于多个项目展开深度合作。
- 最好是海外的华人华侨,公司主体业务在海外,项目薪资以付美金或稳定币为主。所以,希望您可以有相关的账户,以利结算。
- 如有兴趣,可与技术详谈,项目相关情况。
- 联系方式: [email protected] ,请附带您的简历信息。

