大的csv数据处理, 如果用numbers会跑不动, 用各种专业软件会有各种专业的麻烦, 用ruby/coffee会发现什么都要自己写, 用python会发现确实方便
本文档大量参考stackoverflow, 结合了多篇高赞答案, 此处就不一一罗列了.

做这件事有上中下3策

  1. 上策: csv库, 直接组织为dict
  2. 中策: iterable的next, 或者数据直接row切片[1:]
  3. 下策: 循环体内直接if判断, 这个非常蠢, 写出这种代码的同学可以考虑换个工种

代码示例

# 上策
import csv
with open("./悉尼一年订单20220803.csv",'r') as dfile:
 dlist = csv.DictReader(dfile, delimiter=',')
 for item in dlist:
  # 这里是处理代码

# 中策一
import csv
with open("./悉尼一年订单20220803.csv",'r') as dfile:
 dlist = csv.reader(dfile)
 next(dlist, None)  # skip the headers
 for item in dlist:
  # ...

# 中策二
# 2.1, 用切片也行
for row in list(csv_reader)[1:]:
# 2.2, 读文件的时候掠过第一行
import pandas as pd
df = pd.read_csv(r'C:\Users\605760\Desktop\path rec\matrix.csv',skiprows=1)


2023.4.13更新

# 2.2, 读文件的时候掠过第一行
import pandas as pd
df = pd.read_csv(r'C:\Users\605760\Desktop\path rec\matrix.csv',skiprows=1)

# 此时不需要略过, padas自动识别第一行为列名
import pandas as pd
df = pd.read_csv(r'C:\Users\605760\Desktop\path rec\matrix.csv')