-
Notifications
You must be signed in to change notification settings - Fork 43
Examples
jackfengji edited this page Mar 8, 2012
·
4 revisions
有一堆文件,每一行是一个word,统计一共有多少个word count, splitSize reduce
有一堆文件,每一行是一些word,word之间以','隔开,统计一共有多少个word map
有一堆文件,每一行是一些word,word之间以','隔开,统计有多少长度大于10的word map, filter 可以解释惰性等特性
有一堆文件,每一行是一个word,统计每个word有多少个 reduceByKey groupByKey, map collectAsMap
有一堆文件,每一行是一些word,给一个word list,统计word list中每个pair出现的次数等 foreach
有一堆文件,每一行是一个word,后面跟着两个整数,表示uid和timestamp,获取对应每个uid,出现次数最多的K个word combineByKey
有一堆文件,每一行是一句话,同时有另外一个文件,里面每一行是一个word,大概为十万个,希望统计每个word出现的次数