本论文全面探讨了可扩展的会话式推荐系统解决方案,聚焦于以下关键挑战:海量商品目录、数百万用户、稀疏的交互数据,以及大规模推荐数据集的调试问题。本研究与欧洲电商平台 Bol 合作开展,旨在弥合学术前沿成果与工业系统实际需求之间的鸿沟。 第2章聚焦于高效处理数十亿交互数据的算法与框架的设计与部署,这些方案兼具高效性与低延迟特性。相关算法和框架通过离线实验与真实环境部署进行了严格评估。 第3章引入了 VMIS-kNN,这是当前先进方法 VS-kNN 的改进版本。该方法在时间复杂度上更为高效,并通过预构建索引等小型优化措施提升了可扩展性与响应速度,使得推荐计算能够在毫秒级内完成。在六个数据集和多种编程语言实现上的实证评估展示了其有效性。此外,论文还提出了 Serenade——一个面向生产环境的有状态推荐系统,具备高吞吐量与低延迟,能够无缝集成至大规模电商平台中,显著提升了用户参与度等关键业务指标。 第4章重点介绍了 Etude 框架,它为基于神经网络的会话推荐模型在不同部署场景下的推理性能评估提供了一种系统化方法。 第5章则提出了 KMC-Shapley,这是一种面向序列型 kNN 推荐系统的数据 Shapley 值可扩展估计方法。该技术结合算法严谨性与实用性,有效提升了对大规模推荐数据集的调试能力。研究强调了预测性能、系统效率与生态可持续性之间的平衡至关重要。 研究结果验证了邻近算法在特定电商场景下的有效性、系统延迟对用户接受度的关键影响,以及数据价值评估技术在保障基于 kNN 的推荐系统完整性中的作用。本论文开发的开源工具与方法不仅推动了该领域的研究前沿,同时为产业界提供了具有实践价值的参考。通过将理论创新与实际应用相结合,本研究为会话式推荐系统领域作出了重要贡献。