邱军雅博客
python3中使用sklearn处理缺失数据
python3中使用sklearn处理缺失数据

首先,需要导入对应库:

Imputer类就是专门处理缺失数据的类。

假设我们先使用pandas读取了csv文件并选取了自变量的矩阵和因变量的向量:

这时候,我们就可以使用Imputer类来处理缺失数据:

对于Imputer需要传入的几个参数做一个简单说明:

  • missing_values: integer 或者 ‘NaN’(默认值)。
  • strategy:如果是’mean’(默认值),则是取平均数。如果是‘median’,则是取中位数。如果是‘most_frequent’,则是取最常出现的值。
  • axis:如果axis=0,则取列的平均值,如果axis=1,则取行的平均值。
赞赏

发表评论

textsms
account_circle
email

邱军雅博客

python3中使用sklearn处理缺失数据
首先,需要导入对应库: [crayon-5baa1caaec7d9244007722/] Imputer类就是专门处理缺失数据的类。 假设我们先使用pandas读取了csv文件并选取了自变量的矩阵和因变量的向量: [crayo…
扫描二维码继续阅读
2017-11-23