pandas.read_csv将列名移到一个以上。[英] pandas.read_csv moves column names over one

本文是小编为大家收集整理的关于pandas.read_csv将列名移到一个以上。的处理方法,想解了pandas.read_csv将列名移到一个以上。的问题怎么解决?pandas.read_csv将列名移到一个以上。问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

我正在使用all.zip文件位于 there .我的目标是使用它创建大熊猫数据框架.但是,如果我运行

data=pd.read_csv(foo.csv)

列名不匹配.第一列没有名称,然后将第二列标记为第一列,最后一列是一系列NAN.所以我尝试了

colnames=[list of colnames]
data=pd.read_csv(foo.csv, names=colnames, header=False)

给了我完全相同的东西,所以我跑了

data=pd.read_csv(foo.csv, names=colnames)

完美地将colnames列为完美,但具有CSV分配的列名(CSV文档中的第一行),将其与数据的第一行完全对齐.所以我跑了

data=data[1:]

做法.

因此,我在没有解决实际问题的情况下找到了工作.我看着 read_csv 压倒性的,无法仅使用pd._csv来解决此问题.

什么是基本问题(我假设它是用户错误或文件问题)?有没有办法用read_csv的命令之一来修复它?

这是CSV文件的前2行

cmte_id,cand_id,cand_nm,contbr_nm,contbr_city,contbr_st,contbr_zip,contbr_employer,contbr_occupation,contb_receipt_amt,contb_receipt_dt,receipt_desc,memo_cd,memo_text,form_tp,file_num,tran_id,election_tp
C00458844,"P60006723","Rubio, Marco","HEFFERNAN, MICHAEL","APO","AE","090960009","INFORMATION REQUESTED PER BEST EFFORTS","INFORMATION REQUESTED PER BEST EFFORTS",210,27-JUN-15,"","","","SA17A","1015697","SA17.796904","P2016",

推荐答案

这不是您有问题的列,而是索引

import pandas as pd

df = pd.read_csv('P00000001-ALL.csv', index_col=False, low_memory=False)

print(df.head(1))

     cmte_id    cand_id       cand_nm           contbr_nm contbr_city  \
0  C00458844  P60006723  Rubio, Marco  HEFFERNAN, MICHAEL         APO   

  contbr_st contbr_zip                         contbr_employer  \
0        AE  090960009  INFORMATION REQUESTED PER BEST EFFORTS   

                        contbr_occupation  contb_receipt_amt contb_receipt_dt  \
0  INFORMATION REQUESTED PER BEST EFFORTS                210        27-JUN-15   

  receipt_desc memo_cd memo_text form_tp  file_num      tran_id election_tp  
0          NaN     NaN       NaN   SA17A   1015697  SA17.796904       P2016  

low_memory=False是因为第6列具有混合的数据类型.

其他推荐答案

问题来自文件中的每一行,除了第一个在逗号中终止(分隔符).熊猫认为如果需要将第一个"列名"视为索引列,那里有一个空列.

尝试

data= pd.read_csv('P00000001-AL.csv',index_col=False)

本文地址:https://www.itbaoku.cn/post/1727895.html