请教大佬们如何用 pandas 高效读取被分片的 csv 文件

都在一个 csv 文件，那你一次性读完，然后筛不就行了，读完后 EFGH 被当成了行数据，这样的话，你把 EFGH 这种行数据给筛掉不就行了，再不济，既然你已经有 skip 的解决方法，就说明每个分片的长度是固定的，那就先转 list，[begin:end:skip]做切片然后转回 dataframe 不就行了

nano91

Feb 7, 2021

@nano91 dataframe 也可以直接切片，具体可以自己看看

learningman

Feb 7, 2021

换 C++预处理（
C++处理 csv 还算能写

sdushn

Feb 7, 2021

@starzh
@nano91
目前是计划先一次性读取，在给 pandas 之前处理好，按行读取，按分片逻辑把竖着的表处理成横着的，最后一次性给 pandas 转 dataframe

sdushn

Feb 7, 2021

@learningman 流下了没有技术的泪水，C++更不会写了

nano91

Feb 7, 2021

@sdushn 不用横过来，直接 dataframe 切片，每行就是一个元素

sdushn

Feb 7, 2021

@nano91 我去研究一下

cassidyhere

Feb 7, 2021 via Android

各位想复杂了，pandas.read_csv 有现成的 chunksize 参数

xchaoinfo

Feb 8, 2021 via Android

如果你用 Excel 应该怎么处理？
pandas 当成一个可编程的 Excel 。对比下，操作罗辑就很清楚了

Yinz

Feb 9, 2021

@sdushn #8 你的计划是对的，一次文件读取，处理成 dict （可流处理），转成 DataFrame 就可以了