当我们对一些现象进行回归分析之后,可以得到回归方程y=ax+b,很简单的一根直线,如果结合我们的实际应用场景,则可以从该方程的2个系数中发现很多问题:
1 当b比a大很多时,如何理解?
比如,工作量=10*规模+10000
此时:
b=10000为固定成本, a=10为变动成本。
说明在这家公司中,项目一立项就有比较高的固定成本!需要减少无用功,降低很多与直接生产无关的成本!
2 当b为负数时,且很小,如何理解?
比如,有个客户建立了这样一个方程:
开发工作量=198*ln(需求文档字数)- 1470
此时,当开发工作量=0时,需求文档字数约为1100, 意味着什么?意味着通常情况下,在需求文档中大概有1100字是不需要投入开发工作量去实现的,里面有很多废话!
3 当b不应该为负数,却为负数了,如何理解?
比如上述的那个方程:开发工作量=198*ln(需求文档字数)- 1470
说明采样的数据有偏颇,肯定没有需求文档小于1100字,实践中开发工作量不可能为负数,小规模的需求文档缺少样本,该模型不适合小规模的需求文档场景。
小规模场景的规律与大规模场景的规律是不同的!此时要找到点(x0,0),将x<x0的样本与大于0的样本区分开来,分别建立模型。
4 当a大于1时,说明什么?
当a大于1时,说明x每增加一个单位,y的增加大于1个单位,y增加的速度比较快。y 对 x的变化比较敏感。
5 当a小于1时,说明什么?
当a小于1时,说明x每增加一个单位,y的增加小于1个单位,y增加的速度比较慢,y 对 x的变化不敏感。