四分位距校验异常数据
根据提供的价格数据和当前价格4607499卢布,我们可以通过以下统计学方法判断其是否异常:
1. 数据概览
历史数据共12个样本,时间间隔为每周一次(时间戳间隔为604800秒)。价格数据(单位:卢布)如下:
1 | [65500, 60700, 57786, 57756, 57350, 78900, 57706, 77600, 68000, 66600, 66221, 64900] |
2. 异常值检测方法
方法1:Z-Score(标准差法)
- 均值(Mean): ( \approx 64,918 ) 卢布
- 标准差(SD): ( \approx 7,379 ) 卢布
- 当前价格Z-Score:
[
Z = \frac{4,607,499 - 64,918}{7,379} \approx 615.7
]
结论:Z-Score远超过3(通常阈值),表明当前价格是极端异常值。
方法2:IQR(四分位距法)
- 中位数(Median): ( 65,200 ) 卢布
- 下四分位数(Q1): ( 57,771 ) 卢布
- 上四分位数(Q3): ( 67,300 ) 卢布
- IQR: ( Q3 - Q1 = 9,529 ) 卢布
- 正常范围边界:
[
\text{下限} = Q1 - 1.5 \times IQR = 43,477.5 \quad \text{卢布}
]
[
\text{上限} = Q3 + 1.5 \times IQR = 81,593.5 \quad \text{卢布}
]
结论:当前价格远超上限,属于异常值。
3. 时间序列分析(补充)
历史数据中存在短期波动(如最高价78,900卢布),但整体无显著上升趋势。当前价格(460万卢布)远超历史波动范围,无法用趋势或季节性解释。
4. 结论
当前价格 4,607,499卢布 是异常值,原因如下:
- Z-Score超过600,远高于3σ阈值。
- 超出IQR正常范围上限(81,593.5卢布)的50倍以上。
- 历史数据中无任何类似量级的价格波动。
建议
- 验证数据准确性:检查是否存在单位错误(如“卢布”是否为“卢布/千”)。
- 调查外部因素:如系统错误、市场操纵或数据录入问题。
- 若数据无误,需紧急介入调查价格异常原因。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 热心市民黄先生!