1.需求:
1)求每个域名的流量之和
1 | object LogApp { |
2)求每个省份访问次数的TOP10
需求分析:
(省份,1) 拿到省份,然后赋值为1 进行 reducebykey操作 然后降序排序
省份通过 ip拿到 需要用到 IPUtil,这个 需要去买,才能用,解析出来的 第一个字段是国家,第二个是省份,
1 | object LogApp { |
拿到需求,首先要进行分析,分析好以后就是填空
1.需求:
1)求每个域名的流量之和
1 | object LogApp { |
2)求每个省份访问次数的TOP10
需求分析:
(省份,1) 拿到省份,然后赋值为1 进行 reducebykey操作 然后降序排序
省份通过 ip拿到 需要用到 IPUtil,这个 需要去买,才能用,解析出来的 第一个字段是国家,第二个是省份,
1 | object LogApp { |
拿到需求,首先要进行分析,分析好以后就是填空
文章作者:skygzx
发布时间:2019年05月07日 - 10:16
最后更新:2019年05月07日 - 16:14
原始链接:http://yoursite.com/2019/05/07/Sparkcore的Topn代码书写/
许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。