实时广告竞拍平台会产生海量的数据,如何对这些数据进行分析和建模会决定广告竞拍的成败.其中一个重要的问题是,如何得到胜出竞价的概率密度函数以便用于指导竞价.在文献(Cui Y,Zhang R,Li W,Mao J.Bid landscape forecasting in online ad exchange marketplace.Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York:ACM,2011:265-273)中,雅虎实验室提出了一个技术框架来解决这个问题:首先利用合理的统计学方法对海量数据按照特征属性进行分类;再利用高效的数据结构进行存储,以便快速定位特定属性的信息;最后用梯度提升决策树(gradient boosting decision trees,GBDT)模型和有限混合模型(finite mixture model,FMM)学习得到胜出竞价的分布模型.结合国内竞拍平台的数据特点,在上述文献的基础上,对技术框架进行改进,并提出修正的算法.