……
pandas有两种特殊的数据结构:Series和DataFrame。
参考官方10 Minutes to pandasimport pandas as pd
对象创建
1 | # Series |
查看数据
1 | # 查看前几行、后几行 |
选择数据
1 | # 选择单个column |
设置新的值
1 | >>> s1 = pd.Series([1,2,3,4,5,6], index=pd.date_range('20130102', periods=6)) |
缺失值NaN
1 | >>> df1 = df.reindex(index=dates[0:4], columns=list(df.columns) + ['E']) #将df的一部分copy给df1,df不变 |
操作
1 | >>> df.mean() # 求每一列的平均值 |
连接等操作
1 | # concat |
Grouping
1 | >>> df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', |
Reshaping
1 | #Stack |
Categoricals
1 | >>> df = pd.DataFrame({"id":[1,2,3,4,5,6], "raw_grade":['a', 'b', 'b', 'a', 'a', 'e']}) |
plotting
1 | >>> ts = pd.Series(np.random.randn(1000), index=pd.date_range('1/1/2000', periods=1000)) |
读写文件
1 | #CSV |
其实啊,这边基本都是那个官方文档里面的,感觉这样复制一遍,记得多一点》》》