黑马程序员技术交流社区

标题: 用Pandas库中的drop_duplicates()去重无效 [打印本页]

作者: 庭院深深深几许    时间: 2019-3-5 14:33
标题: 用Pandas库中的drop_duplicates()去重无效
  以下是相关部分代码。用下面的代码得到的结果是带有重复行的,这意味着drop_duplicates()没有起作用。程序执行完成后,我再单独执行去重的语句,结果又是正确的。不知道问题出在哪里。求老师解答!!!
  如果路径/文件存在
  if os.path.exists(filepath):
  #读取已有数据
  data_road_exist = pd.read_excel(filepath)
  #将新增数据追加到原有数据中
  data_road_exist = data_road_exist.append(road_rank ,ignore_index=True)
  #去除重复数据
  data_road_exist.drop_duplicates()
  #将数据写入指定文件
  out = pd.ExcelWriter(filepath)
  data_road_exist.to_excel(out)
  out.save()
  else:
  pd.DataFrame.to_excel(road_rank,filepath)


作者: 庭院深深深几许    时间: 2019-3-5 14:33
drop_duplicates()是一个执行方法,就是说它的效果只是将去重后的结果输出(如果是写在最后一行),它不是将去重后的结果再返回给去重目标。因此,你要想得到你想要的结果,需要data_road_exist=data_road_exist.drop_duplicates()




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2