亚马逊平台BSR(Amazon Best Seller Rank)算法的神秘与规则的多变,给卖家准确估计所选商品的市场规模、科学预测所选市场的盈利水平带来了很大的困扰。
为了帮卖家解决这一心头病,准确估算销量,克服亚马逊复杂的算法与适应形势多变的市场,成为数魔的核心工作之一。
以下列出了当前市场上,具有销量估算功能的部分工具。
我们深知,如果这件事情做得不好,销量估计偏高或者偏低,都会给卖家造成精力、钱财的损失。在复杂多变的亚马逊算法面前,要做到全区间段以100%的准确率估计销量很难。但是我们仍旧不断努力,不断逼近销量的真相。
那幺什幺是销量估计的准确率,或者说什幺是卖家期待的准确的销量估计?
我们提出了一种评估亚马逊销量估算准确度的标准——销量四准法则。
总体销量准确
需要确保在同一时间段内,全站点全类目所有商品的销量总和与亚马逊真实的GMV体量相等。例如,如果亚马逊一天的GMV为10亿美元,而基于预测得到的单日销售额只有5亿美元,则总体准确率只有50%。
各个类目销量准确
亚马逊美国站仅一级类目就有25+个,核心类目有家居、服装、3C电子产品、汽配、美妆、书籍……在销量估算的过程中,只要有一个类目准确率不够高,就算不上成功的算法。
类目区间段销量准确
需要确保各类目各区间段的销量估算均准确。目标:Top 100商品的销量估算准确率高,1万~2万的准确率,100万~200万的准确率均高……
每天的销量估算准确
需要确保各活跃商品每天的销量估算均准确(算法高稳定性)。
根据亚马逊官方文档,亚马逊BSR每小时都会更新一次,计算依据是listing的销量等因素。当某个Listing销量增加时,该listing的BSR排名一般也会得到提升(但未必是同步进行),而某个Listing的BSR上涨时,往往也是源于销量的增加。那BSR值和销量之间的关系到底是怎幺样的,就很考验数据服务商的技能了。
一般来说,计算预测结果的准确度有以下几种方式。
1.平均绝对值误差(MAE)
又称为L1范数损失。用于评估预测结果和真实数据集的接近程度,其值越小说明拟合效果越好。可以更好地反映预测值误差的实际情况。
优点:可以把绝对误差和相对误差里面正负相互抵消的问题去掉。
缺点:绝对值的存在导致函数不光滑,在某些点上不能求导。
2.均方方差(Mean squared error,MSE)
又称L2范数损失,该指标计算的是拟合数据和原始数据对应样本点的误差平方和的均值,其值越小说明拟合效果越好。
优点:解决了方式①平均绝对误差的不光滑问题,即不可导问题。
缺点:MSE与我们的目标变量的量纲不一致,为了保证量纲一致性,我们需要对MSE进行开方,得到RMSE。
3.均方根误差(RMSE)
均方误差再开平方,即均方方差进行开方求得。
优点:同时解决了方式①的不可导问题与方式②的量纲不一致问题。
缺点:使用平均误差计算,而平均值对异常点较敏感,如果对某个点的回归值很不理想,那幺它的误差则较大,从而会对RMSE的值有较大影响。
4.R-square 决定系数
衡量的是回归方程整体的拟合程度,是表达回归平方和在总平方和中所占的比率。取值范围为[0,1],其值越接近于1,表明模型拟合效果越好。
优点:既考虑了预测值与真值之间的差异,也考虑了问题本身真值之间的差异,是一个归一化的度量标准。
缺点: 数据集的样本越大,R²越大,因此不同数据集的模型结果会存在一定的差异。
5.平均绝对百分误差
真实值与预测值之间绝对百分比的平均值
优点:直观、计算简单,克服了对标度的依赖。
缺点:MAPE没有上界, 因此对异常值敏感. 当某个pt非常大时, 会导致MAPE的值也显着变大。如果使用MAPE作为误差评价指标,pt的不对称性会导致预测销量低于实际销量。
综上,我们采用了第5种评价标准——平均绝对百分误差。该方法是所有方法中最严格的,也是最能全面反应不同销量区间的综合准确率。
SellerMotor基于各类目BSR数据等指标,迭代升级了销量估计算法,相较之前的估计结果,准确度得到了很大的提升。
目前全新的数据模型已经在亚马逊美国站实现19个类目数据覆盖,未来将进一步覆盖更多类目及站点。