WordCount

任务:统计某文档的单词数量

Python

1 data=pd.read_csv(file,sep="\n",header=None)
2 tmp=[]
3 data=data.iloc[:,0].apply(lambda x:tmp.extend(x.split()))
4 pd.Series(1,tmp).groupby(level=0).count()

这里只是对文档按空字符分割,如果要去掉其他无统计意义的标点符号则会非常麻烦。

集算器

  A  
1 =lower(file(“T.txt”).read()).words().groups(~:word;count(1):count)  

集算器提供了words()函数将串拆分成单词,只要一句就可以完成这个运算。