`

The Power of Linear Programming in Sponsored Listings Ranking: Evidence from Field Experiments

创建于 更新于

摘要

本文针对在线市场中的Sponsored Listings Ranking问题,提出基于线性规划(LP)的排名算法,解决传统得分排序方法面临的多目标权衡和性能受限问题。通过与某领先全球市场平台(Marketplace A)合作开展的为期19天、覆盖3.29亿次访问的A/B实地实验,发现LP方法相较极致调优的得分排序算法,能在GMV、购买率及平台收入等主要指标分别提升1.39%、1.55%和1.80%。该方法不仅效率高,满足0.1秒的时延要求,还具备灵活性,可整合长期全局规划约束,推动Sponsored Listing的多维度优化和实践落地 [page::0][page::2][page::3][page::5][page::14][page::15][page::18][page::22][page::23][page::27]

速读内容

  • 研究背景与问题描述 [page::0][page::1][page::2]:

- Sponsored listing作为诸如亚马逊、沃尔玛、阿里巴巴等电商平台的重要收入来源,需均衡提升平台总收入与推荐内容的相关性。
- 目前主流采用基于得分的排序算法,方便高效但面临权衡困难与灵活性不足的问题。
  • 线性规划(LP)模型及算法设计 [page::3][page::10][page::11][page::12]:

- 将排名问题建模为混合整数规划(MIP),通过LP松弛和对偶算法实现近似最优解。
- 设计快速的二分搜索对偶变量算法,保证在0.1秒时延限制内完成排名计算,结果整数且接近最优。
  • 算法性能对比与优越性 [page::13][page::14][page::15][page::16]:

- 实验规模涵盖典型最大问题规模(50槽位,500候选品),LP算法比工业级Gurobi LP求解器快20倍以上,同时优劣性在0.05%范围。
- 随问题规模扩大,LP方法优势显著,满足在线时延要求远优于传统求解器。
  • 实地A/B测试设计及数据统计 [page::15][page::16][page::17]:

- 在Marketplace A的桌面端开展19天随机实验,纳入超过3200万用户与3.29亿次展示。
- 设三个组:LP90、LP95(基于不同相关性参数λ)和原生产得分排序算法(基准组)。
- 实验随机性检验表明分组均衡,无显著偏差。
  • 实验主要结果与指标提升 [page::18][page::19][page::20]:


- LP90组相较基准组,收入、GMV和购买数分别提升1.80%、1.39%、1.55%;LP95组提升较为平衡,GMV提高近3%。
- 平均交易价格略低于基准,证明收入提升非价格提升驱动。
- 回归分析显示LP方法通过呈现更相关商品推升销售,而非单纯抬高价格。
  • 异质性效应分析 [page::21]:

- LP方法对高购买量及高购买点击比率的展示印象产生较大增益。
- 该优势源于LP优化直接最大化收益,区别于得分优化的间接目标。
  • 收入相关性权衡探讨 [page::22][page::23]

- 通过调整λ参数实现收入-相关性权衡:λ下降可提升收入但降低购买数。
- 实验显示λ从0.75升至0.90,收入相对升高约1.2%,购买数下降约1.2%。
  • 线上整体规划模型拓展 [page::24][page::25][page::26]:

- 介绍通用LP框架结合库存约束、卖家和消费者多维度需求的整体规划优化。
- 离线求解大规模LP问题以获得对偶变量指导线上排名决策。
- 实验中采用PDLP算法处理近3亿变量的整体规划问题,显著优于商业求解器。
  • 结论 [page::27]:

- LP排名算法显著超越得分型方法,兼顾效率、准确性及灵活扩展性。
- 实地大规模验证充分证明理论与工程结合的可行性与成效。

深度阅读

资深金融分析师对报告《The Power of Linear Programming in Sponsored Listings Ranking: Evidence from Field Experiments》的详尽分析



---

1. 元数据与概览



报告标题:《The Power of Linear Programming in Sponsored Listings Ranking: Evidence from Field Experiments》
作者:Haihao Lu, Luyang Zhang, Yuting Zhu
发布机构与时间:合作领先在线全球市场“Marketplace A”,实地实验于2022年4月启动,LP算法于2023年1月投产。
研究主题:探讨线性规划(LP)算法在电商平台赞助商品排名(Sponsored Listings Ranking, SLR)中的应用效果,对比传统基于评分(score-based)的排名方法,利用实地大量流量A/B测试验证其效力。

核心论点:
  • 赞助商品排名问题核心在于权衡整体营收最大化与消费者浏览体验(相关性)之间的冲突。

- 传统score-based算法存在定义评分函数的限制,难以优化多目标的Pareto效率,且不易处理约束条件。
  • 提出混合整数规划(MIP)问题建模SLR,进一步通过LP松弛及高效的原始-对偶算法近似求解,满足线上严格时延(0.1秒)要求。

- 通过在“Marketplace A”19天共3.29亿次展示的场景下的实地实验,LP方法相比市场成熟的score-based方法带来1.80%收入提升,1.55%购买提升,及1.39% GMV提升,且LP方法的推荐相关性更高。
  • 该LP模型被成功上线,标志着LP在实务中可行且优于score-based排名方法。


总体,报告证明了LP基优化模型及算法在线上广告排名中的竞争优势及工程可落地性 [page::0,1,2]。

---

2. 逐节深度解读



2.1 引言及背景(第0-1页)


  • 赞助商品(Sponsored Listings)是Amazon等多数大型电商的主要收入来源,广告费直接关联排名展示。

- 排名核心挑战是既提升收入又确保推荐给消费者精准相关的商品,受时延限制,因此业界普遍采用基于“预测-再优化”的score-based算法。
  • Score-based方法效率高,可在线完成排位,但因评分函数定义限制,无法灵活保证多目标均衡和资源约束。

- 论文旨在提出LP方法能克服score-based缺陷,并通过实地实验验证。

清晰指出SLR问题的业务本质和学术研究价值,为LP应用奠定基础,强调时延、解释性、灵活性为算法设计核心需求 [page::0,1]。

---

2.2 传统Score-based方法缺陷与LP模型提出(第2-3页)


  • Score-based排名的局限在于依赖评分函数且难以保证单一多目标性能,是启发式且缺乏显式约束的手段。

- SLR可建模为MIP,目标最大化总营收,保障相关性等软约束,但MIP难以线上实时求解。
  • 论文利用对偶原理设计高效算法,支持在0.1秒完结排序任务。

- 大规模实验证明LP算法性能全面超越调优score-based,收入、购买及GMV均有1-2%显著提升。
  • LP带来的提升来源于更丰富相关商品的展示,而非价格提升,避免类似“价格歧视”的弊端。


明确LP模型从理论到实践的改进意义,强调以MIP形式表达多目标决策的优势及通过松弛+对偶算法保障性能和时延 [page::2,3]。

---

2.3 相关文献综述(第3-5页)


  • 综述主要聚焦推荐系统中排名问题,现有score-based方法多样,领域成熟但固有限制。

- 提及广告分配的数学规划文献,涉及公平、资源限制等多目标约束的MIP解决方案。
  • 介绍多目标优化与权衡,如消费者效用、公平性、内容多样性等,并指出LP方法天然可融入全局复杂约束。

- 关联选择题与展示优化中的分配问题、离散选择模型(MNL等)的应用和局限。

充分表明本文在理论上的创新和对相关工作差异,且定位于领域首个将LP方法大规模上线的实证研究 [page::3,4,5]。

---

2.4 Marketplace A背景及score-based基线(第6-9页)


  • Marketplace A描述包含两大排名问题:关键词排名(KR)和赞助商品排名(SLR)。

- SLR目标:基于种子商品推荐相关的补充或替代品,兼顾消费者兴趣和平台收入。
  • 收入结构拆分为“take fee”(有机收入)和“sponsorship fee”(广告收入)两类,二者存收入与相关性权衡。

- Score-based算法含三步:候选集选取(基于类别与KNN历史挖掘消费者偏好)、购买转化率(PTR)预测(XGBoost模型)、打分排名(综合预测的有机和广告收入,参数w调节比重)。
  • 尽管评分函数经过长时间极限调优,算法仍受限于评分函数定义的固有限制。


报告详述行业背景及score-based算法设计,有助理解后续LP方法的对照和优势分析 [page::6,7,9]。

---

2.5 LP模型详细设计及近似求解算法(第10-14页)


  • MIP定义:决策变量X为指示变量,控制各商品分配至展示位,约束不重复分配,目标为最大化权重加权期望营收,约束相关性不低于$\lambda$倍最大相关性。

- 及时延需求使精确求解不可行,改用LP松弛,变量改为区间[0,1]。
  • 基于原始-对偶方法设计双变量二分算法(算法2):

1) 检查相关性约束冗余情况;
2) 通过对偶问题寻找最优对偶变量$\mu^$区间;
3) 利用二分法逼近$\mu^
$并生成可行排名。
  • 算法理论基础包括互补松弛条件、凸优化性质,保证解的可行性和近优性,且极具运行效率。


此部分清晰阐述数学模型并给出切实可行、面向工程的算法框架,专业且严谨 [page::10,11,12,13].

---

2.6 算法性能比较及规模扩展实测(第14-16页)


  • 通过模拟不同问题尺寸及相关性参数$\lambda$,对比LP算法与工业级商业求解器Gurobi。

- 寻求满足0.1秒延时和近优解的平衡,LP方法平均比Gurobi快20倍以上,规模大时优势更明显(如m=500, n=500时超过100倍),而且最优差距极小(<0.005%)。
  • 规模扩展测试表明,LP算法对大规模数据有较好鲁棒性和时间效率。

- 实地实验设计严谨,覆盖19天3.29亿次展示,通过唯一消费者ID分层随机确保对照组和实验组的均衡性和可比性。
  • 设定两种LP算法($\lambda=0.90,0.95$)场景,benchmark为调优score-based算法。


实验和算法设计兼顾理论性能和实际部署需求,数据量巨大的实地随机试验为数据可信度背书 [page::14,15,16]。

---

2.7 实地实验结果及深入数据分析(第17-21页)


  • 统计描述表明三组样本均衡无显著差异(p-value均显著大于0.1),确保结果归因实验处理。

- 核心财务指标:
- LP95比基准提升收入0.81%,GMV 2.96%,购买数3.22%,其中GMV和购买提升显著(p<0.001)。
- LP90提升收入1.80%,GMV 1.39%,购买数1.55%,GMV和购买显著。
  • 平均交易价格反而微降(-0.2%),排除了通过提价增加收入的可能,表明收入增长来自于更精准的推荐及销量提高。

- 回归分析(OLS)显示,LP算法对应的每次展示的收入和购买率显著提升,平均推荐相关度(Weighted PTR)更高,购买更多集中在前5排名内,验证排名质量提升。
  • 异质效果分析发现,当单次展示有多件购买或推荐项目高质(购买/点击率高)时,LP算法的收入优势显著增强,说明LP算法能快速捕获高潜力机会。

- 第二轮实地试验通过调整$\lambda$揭示了相关性与收入间的权衡规律,$\lambda$降低时收入增加而购买下降,图表加深了对该权衡动态的理解。

实验数据及严密统计分析充分证明LP算法改进订购绩效的机制,强化了其商业价值和精细操作空间 [page::17,18,19,20,21,22,23]。

---

2.8 LP模型整体规划扩展(第23-27页)


  • 探讨实际场景中更复杂的全局约束需求,如卖家库存限制、收入目标、多样性需求等,score-based方法难以实现。

- 定义大规模LP模型,编码上述全局规划限制,在历史数据周期(即“离线”)上求解最优解。
  • 利用双变量(对偶变量)作为折价调整,在线上实时排名中调整排序目标函数,以满足整体限制。

- 该大型LP问题变量超过2.6亿,约束2.6千万,规模超常,商用求解器Gurobi(多种求解方法)与最新LP求解工具PDLP比较。
  • PDLP表现最佳,速度是Gurobi barrier算法的两倍以上;Dual Simplex方法因数值问题失败,Primal Simplex超时。

- 实验表明基于LP的整体规划在现代计算条件下可行,灵活性及规模处理能力强,有助市场维护多方利益和长期逻辑。

整体规划扩展展示LP算法的高度可定制性与规模可操作性,助力解决复杂电商生态平衡问题 [page::23,24,25,26,27]。

---

3. 图表深度解读



图1和图2展示市场显示界面


  • 图1a,展示关键词搜索结果页面,含类别筛选项、商品排名列表,及广告标识。

- 图1b,为赞助广告的推荐位,紧邻种子商品,面向相关或互补品。
  • 图2说明了Sponsored Listings在iPhone和iPad不同设备上的展示形式,强调多设备适配的排名策略需求。

图像印证实际展示点,说明研究场景真实性与复杂多样的展示需求 [page::8]。

表1与表2(第14-16页)


  • 表1显示不同相关性参数$\lambda$下,LP算法与Gurobi运行时间对比,LP算法速度提升均大于20倍,同时最优差距均小于0.05%。

- 表2涵盖不同问题尺寸下LP算法与Gurobi性能对比,尺寸增长时LP优势更显著(m,n最大达500),LP算法能满足0.1秒实时要求,而Gurobi仅能解决较小场景。
表格明确直观呈现算法优越性和工业适用性 [page::14,15,16]。

表3(第17页)随机化验证


  • 统计消费者与曝光量的均衡分布,p值均高于显著性水平,确认分配随机化。

确保实验设计合理且无偏差 [page::17]。

表4(第18-19页)实验主效应指标


  • 收入、GMV、购买次数均有正向提升,GMV和购买次数改善显著,价格则微降,表明LP非依赖提价提升营收。

数据直接支撑LP算法商业价值 [page::18,19]。

表5(第20-21页)回归结果


  • LP算法在销售频次、购买转化率提升显著,且负向影响均被排除(如价格无提升或下降),位次更优。

验证定量机制,非表面变量变化 [page::20,21]。

表6(第21页)异质性效应


  • 购买量和购买-点击率高的场合LP收益差明显拉大,提示LP算法更能针对高价值机会精准运营。

深化理解场景适用性 [page::21]。

图3(第23页)相关性-收入权衡图


  • 展示不同$\lambda$对应购买数和收入的相反趋势,体现LP模型参数调节对收益质量的控制能力。

突出策略灵活性与多目标权衡的可调节性 [page::23]。

表8(第27页)整体规划大规模LP求解结果


  • 多种解法比较,PDLP最快且稳定,表明大规模整体规划可实际解决。

支持LP模型大规模应用前景 [page::27]。

---

4. 估值分析



报告核心非传统金融估值问题,但应用运筹优化模型即MIP及其LP松弛求解。LP法实际上是最优化评估的工具:
  • 以预计未来购买转化率和收入率作为权重,以实际收益和相关性为目标。

- LP中相关性阈值$\lambda$的调节类似风险偏好选择,实现了收益-相关性的权衡。
  • 双变量法结合二分搜索,提高计算速度及解的近似优度。

整体算法由运营数据支撑,非财务估值但包含优化决策精确评估 [page::10-14]。

---

5. 风险因素评估



报告未明确列出风险章节,但论文内容间接体现风险与限制:
  • 评分函数局限与可能的rank suboptimality是传统方法潜在风险。

- MIP求解时延挑战直接影响实施可行性,算法创新解决此风险;
  • LP松弛的近似性风险被证明极小,且实证验证表明效果稳定。

- 大规模整体规划的线性规划求解,潜存数值和计算资源风险,但现代算法及硬件能缓解。
  • 线上实验未涉及用户行为变化和模型中断风险,也未披露长期客户体验影响。


作者关注算法实际适用风险控制,尽力提供缓解方案,但细节可进一步展开 [page::2,3,14,26]。

---

6. 批判性视角与细微差别


  • LP模型求解依赖历史数据的准确性与实时性,若PTR估计误差增大会影响模型效果,报告中此隐含假设未详细检验。

- 线性权重假设(相关性与收入线性叠加)可能忽略非线性或用户异质性影响,未充分讨论。
  • 实验仅涉及Desktop Web通道,移动端表现及多渠道整合尚未深入,限制结论外推。

- 实验规模虽大,但仅一领先平台数据,平台特性推动了算法适用性,通用性需额外验证。
  • LP方法虽灵活支持复杂约束,但规模庞大时求解时间及资源仍需关注实际运行成本。

总体报告扎实,创新突出,部分假设和系统外因素有待进一步研究验证 [page::15,27]。

---

7. 结论性综合



本报告系统地介绍了将线性规划方法应用于电商平台赞助商品的排名问题,相较目前行业标准score-based排名,LP方法通过明确建模多目标及约束(营收与相关性的权衡、库存、卖家多样性等)极大提升了排名质量及商业结果。

最关键发现包括:
  • LP算法在严格0.1秒延时内,通过特定对偶二分算法实现求解,解决了MIP不可实时解决的难题。

- 19天3.29亿次展示的实地A/B测试验证,LP相比最优调试的score-based算法实现收入提升1.80%、购买提升1.55%、GMV提升1.39%,且相关性提升,非通过提价提升收益。
  • 细粒度回归分析和异质性研究进一步厘清LP算法绩效提升机制,特别在多购买及高质量推荐场景表现更佳。

- LP算法的灵活扩展支持含库存与卖家多样性在内的整体规划,且通过大型LP求解器高效解决,满足复杂商业需求。
  • 该算法已于2023年正式投产,标志工业级实用价值。


综合而言,LP方法为赞助商品排名提供了更具理论支撑和实务可行的新范式,具备推广潜力,特别适合多目标权衡及全局约束下的个性化推荐系统优化。报告以详实数据、先进算法和现实世界规模验证,填补了该领域实证不足的空白,为电商平台广告排序优化提供了重要参考。



---

溯源标注:全文分析引用页码详细见每部分斜边页码标注,如[page::0,1,2]、[page::14,15,16]等。

报告