这是统计学箱形图中的概念。
下面是一个典型的箱形图:

栅栏值就可以想象成是一个牧场的边界,在两个边界以外的样本就可以被视为是离群了. 它是一个理论值,是计算出来的
一般绘制箱形图时的步骤是:
1)先把所有样本从小到大排好(包括离群值,因为这个时候你还不知道那些是离群的),然后找出中位数(Q₂);然后找出位于上、下四分点的两个数,即上四分位数(Q₃)和下四分位数(Q₁),然后就可以把Q₁Q₂Q₃画在图上了。
2)计算四分位距(interquartile range): IQR = Q₃ - Q₁,也就是图中那个箱子的高度。
3)套公式算栅栏值(upper/lower fences):
上栅栏值 = Q₃ + (1.5 * IQR);
下栅栏值 = Q₁ – (1.5 * IQR).
上下栅栏值以虚线表示。
4)把上下栅栏值以外的样本设为离群值,星号或打点表示;上下栅栏值以内的最大值和最小值(最大非离群实测样本值和最小非离群实测样本值)以横线表示,作图完成。
至于栅栏值为什么是乘以1.5得到,这是与统计学正态分布有关,乘以1.5的时候相当于左右扩展了三个σ少一点,取了大约99%的数据,不多不少。
(有时为了取到其他范围,可能会乘以3之类的)
