如果你是要去掉那些列向量中偏差较大的值的话,你可以先把每列 的整体分布求出来,再去掉离群值,或者用boxplot函数画出每列的箱图,离群值范围就能找出来了。 一般在实际中采用 样本点-平均值>3*标准差 来确定异常点,但是在统计学中有专门的理论来研究异常数据,比如戈罗伯斯检验法 。
首先要根据一定标准检出这些格点,然后删除=[]或者NAN