项目八 数据清洗 一、单选题 1. 下列选项中,描述不正确的是( B ) A. 数据清洗的目的是为了提高数据质量 B. 空值一定要删除 C. 数据预处理包括数据的清洗、合并、重塑与转换 D. 在Pandas中,缺失值使用NaN表示 2. 下列选项中,用于删除缺失值或空值的方法是( B ) A. isnull() B. dropna() C. notnull() D. fillna() 3. 下列选项中,说法不正确的选项是( A ) A. fillna()函数不能通过inplace参数来确定是否对原始数据集进行填充更改 B. 使用位于空值前面的数据进行填充的代码是df.fillna(method='bfill') C. 使用位于空值后面的数据进行填充的代码是df.fillna(method='ffill') D. 用平均值填充空值的代码是df.fillna(df.mean()) 4. 对于下列代码生成的数据集df,下列哪个选项的结果和其他三个选项不一样( C ) import pandas as pd data = {"姓名":['李彦','赵科','章丽','王静','彭伟','金子'],"性别":['男','男','女','女','男','女']} df = pd.DataFrame(data) A. df.duplicated(subset=['性别']) B. df.duplicated(subset='性别') C. df.duplicated(subset=['性别'],keep='last') D. df.duplicated(subset=['性别'],keep='first') 5. 下列选择项中,用于删除重复值的函数是( A ) A. drop_duplicates()函数 B. drop()函数 C. dropna()函数 D. del()函数 二、实操题 实操题答案见“代码”文件夹下“ch8”文件夹中的“项目八-技能训练-实操题.ipynb”。 本文来源:https://www.wddqw.com/doc/8ba698c487254b35eefdc8d376eeaeaad1f316ef.html