如何使用pandas从csv中读取特定的列索引[英] How to read specific column index from csv using pandas

本文是小编为大家收集整理的关于如何使用pandas从csv中读取特定的列索引的处理方法,想解了如何使用pandas从csv中读取特定的列索引的问题怎么解决?如何使用pandas从csv中读取特定的列索引问题的解决办法?那么可以参考本文帮助大家快速定位并解决问题。

问题描述

是否有某种方法可以使用pandas(最好是read_csv)从CSV文件中读取特定索引的特定列?我了解READ_CSV提供了通过列名读取特定列的能力,但是数据文件没有标题,因此我不能使用列名.请注意,该文件太大,因此我不想在整个文件中读取然后子集.谢谢.

推荐答案

这是一个示例,说明了Edchum给出的答案.加载CSV文件还有很多其他选择"> API参考.

raw_data = {'first_name': ['Steve', 'Guido', 'John'],
        'last_name': ['Jobs', 'Van Rossum', "von Neumann"]}
df = pd.DataFrame(raw_data)
# Saving data without header
df.to_csv(path_or_buf='test.csv', header=False)
# Telling that there is no header and loading only the first name
df = pd.read_csv(filepath_or_buffer='test.csv', header=None, usecols=[1], names=['first_name'])
df

  first_name
0      Steve
1      Guido
2       John

其他推荐答案

import pandas as pd
data = pd.read_csv('file.csv', usecols=['column_name'])

usecols的参数包含列名的列表.如果需要多个列,请通过逗号即将它们分开,即['column_name1, 'column_name2', 'column_name3']

本文地址:https://www.itbaoku.cn/post/1728080.html