摘要 : 随着Hadoop的流行与Hadoop Yarn的出现,集群的规模越来越大.在Hadoop生态圈中对集群运行状态的开源实现已经很成熟,但是尚未有对一个对 Hadoop 作业的运行趋势进行统计分析的平台.本文介绍了一个面向Hadoop Yarn的作业资源统计分析平台,面向集群管理员... 展开
作者 | 曹政 |
---|---|
作者单位 | |
英文名称 | Design and Implementation of Hadoop's Log Statistics Analysis System Based on Mahout |
期刊名称 | 《软件》 |
期刊英文名称 | 《computer engineering & Software》 |
页码/总页数 | 43-47,51 / 6 |
语种/中图分类号 | 汉语 / TP399 |
关键词 | 关键词 数据分析 Hadoop Yarn 作业分析 机器学习 Mahout |
DOI | 10.3969/j.issn.1003-6970.2015.11.012 |
机标主题词 / 分类号 | 统计分析;集群;维数 / C8;TP303;O14 |