数值型变量可以计算各种不同的统计量, 如平均值、标准差和各个分位数。 summary()可以给出最小值、最大值、中位数、四分之一分位数、四分之三分位数和平均值。如

summary(tax.tab[["营业额"]])
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##       0     650    2130  247327    9421 6048000

中位数是从小到大排序后排在中间的值。 四分之一和四分之三分位数类似。

统计函数以一个数值型向量为自变量, 包括sum(求和), mean(平均值), var(样本方差), sd(样本标准差), min(最小值), max(最大值), range(最小值和最大值)等。如

mean(tax.tab[["营业额"]])
## [1] 247327.4

sd(tax.tab[["营业额"]])
## [1] 1036453

如果数据中有缺失值, 可以删去缺失值后计算统计量, 这时在meansd等函数中加入na.rm=TRUE选项。


来源:《统计软件》-李东风