最近用到Python处理数据比较多,所以写一下总结
resultTable = pd.read_table(path=, names=[‘user_id’,’day’], encoding=’utf-8′, sep=’\t’, )
读取txt中的文本信息以\t分割,转化为DataFrame形式

分割DataFrame
resultTable[resultTable.day >= 24]可以分割出部分集

取列方式
resultTable [[‘user_id’]]
resultTable.user_id
返回的也是dataframe形式

遍历方式
for id in resultTable.index:
(int(resultTable.loc[id].values[0]),str(resultTable.loc[id].values[1])

去重方式
drop_duplicates()(还可增加参数实现针对列去重)

导出方式
to_csv(path+”userid.csv”,encoding=’utf-8′,index=None,header=None)

KAI Python, 编程语言