下面以双色球中奖数据作为示例利用hive外部表来统计双色球近10年每1列每个数字的中奖次数
一、下面文件shuangseqiu.dat是近10年双色球的所有中奖号码,格式如下
总共7列前面6列为红球,後面一列为蓝色球
二、针对以上数据存放格式创建一个外部表与该文件做映射关联
三、加载双色球数据都HDFS的/user/shuangseqiu目录这里我使用以前存放到HDFS目录下
四、利用hive sql语句统计每一列每个数字出现的次数