中国科学技术信息研究所--国家工程技术数字图书馆

[学位论文] 胡家斌武汉理工大学 2007年硕士导师: 李方敏共63页

摘要 : 网格计算是借鉴电力网的概念提出来的。利用网络把分散在不同地理位置的计算机组织成一个“虚拟的超级计算机”，给用户提供可靠的、协调的、无处不在的和低廉的高端计算能力。计算网格为解决科学和工程领域一些大规模计算问题提供了理想的平台。 ... 展开网格计算是借鉴电力网的概念提出来的。利用网络把分散在不同地理位置的计算机组织成一个“虚拟的超级计算机”，给用户提供可靠的、协调的、无处不在的和低廉的高端计算能力。计算网格为解决科学和工程领域一些大规模计算问题提供了理想的平台。作业调度管理系统是计算网格中一个关键性的研究课题。在网格环境中，作业从提交给网格系统到作业结果处理完成，都一直处于网格作业管理系统的管理之下。由于网格具有大规模、异构、动态、分布和自治等特性，如何调度作业以满足用户的需求是一个极具挑战性的问题。在研究分析计算网格作业调度算法现有成果的基础上，本文提出了一种基于贪心策略的Greedy Sufferage调度算法，并对网格门户下的作业管理系统进行简单的实现。具体工作如下： (1)通过研究传统的网格作业调度的模型，考虑了网络延迟因素后，建立一个新的计算网格作业调度的数学模型。该模型提出资源耗费为作业占用资源的时空乘积，同时又兼顾跨度，让总运行时间减少。 (2)分析传统的Sufferage，Min Max算法，结合数学模型和贪心策略，提出了Greedy Sufferage算法，并对该算法做了详细描述和定性分析，从理论上论证该算法的合理性和优越性，并结合Java语言进行了实现设计。 (3)利用网格仿真平台，将Greedy_Sufferage，Min_Max，Sufferage三个算法进行仿真比较，从而反映出Greedy_Sufferage无论是在平均等待时间，吞吐率方面都得到提升，提高了系统的效率和资源的使用率。 (4)针对Greedy_Sufferage算法，设计网格作业管理系统NJMS(NetworkJob Management System)实现网络资源优化利用。NJMS对作业所要求的资源进行选择和分配，并进行任务的调度和作业执行的控制，并对该系统进行模拟实现，其主要目标是强化操作系统的作业管理功能，以便更加有效地利用系统资源、平衡网络负载、使资源利用尽可能最大化。收起

关键词 : 网格计算作业调度管理贪心策略作业管理网格作业调度

2. 面向混部场景的Spark作业调度策略研究

[学位论文] 李硕北京工业大学 2020年硕士导师: 梁毅共75页

摘要 : 数据中心混部技术是指将以在线服务为代表的延迟敏感型应用与以数据吞吐率为目标的批处理应用混合部署于数据中心相同的资源平台，通过批处理应用充分利用延迟敏感性应用请求波动导致的资源碎片，提升数据中心的资源利用率。Spark是混部场景下，批处理... 展开数据中心混部技术是指将以在线服务为代表的延迟敏感型应用与以数据吞吐率为目标的批处理应用混合部署于数据中心相同的资源平台，通过批处理应用充分利用延迟敏感性应用请求波动导致的资源碎片，提升数据中心的资源利用率。Spark是混部场景下，批处理应用的主要运行支撑平台。如何在资源动态波动的背景下，通过合理的作业调度，在保障延迟敏感性应用服务质量的前提下，提升Spark批处理应用的执行效率，是数据中心混部场景面临的主要技术挑战。针对上述问题，本文提出了一种面向混部场景的Spark作业调度策略，在保障延迟敏感型应用服务质量的前提下，最大化Spark批处理应用达到软实时要求的比例及其资源利用率。本文的主要贡献总结如下: (1)量化分析了Spark批处理应用执行时间的可分类的特征。基于具有代表性的Spark批处理应用，量化分析输入数据规模和资源配置对应用执行时间的影响，分析结果表明，在相同的输入数据规模与资源量配置下，Spark批处理应用间的执行时间具有明显的差异;且在不同的输入数据规模或资源配置情况下，Spark批处理应用执行时间的分类具有稳定性。由此，验证了Spark批处理应用执行时间具有可分类性。 (2)提出了一种考虑应用特征差异的Spark批处理应用执行时间预测方法。该方法首先利用斯皮尔曼相关系数和均值漂移聚类算法(Mean Shift)对Spark批处理应用执行时间进行分类;针对每一类Spark批处理应用，采用主成分分析法(PCA)和梯度提升决策树(GBDT)算法对Spark批处理应用执行时间进行预测。最后当即席Spark批处理应用到达之后，先判断其所属应用类别继而使用相应的预测模型来预测其执行时间。实验结果表明，与采用统一预测模型相比，本文提出的基于分类的Spark批处理应用执行时间预测模型可使得预测结果的均方根误差和平均绝对百分误差平均降低32.1％和33.9％。 (3)提出了一种面向混部场景的Spark作业调度策略。该策略基于Spark批处理应用执行时间预测结果，以最大化Spark批处理应用达到软实时要求的比例和资源利用率为目标，利用二次搜索粒子群(TSPSO)算法优化设计面向混部场景的Spark批处理作业调度策略。实验结果表明，与Spark常用的FIFO、Fair和DRF作业调度策略相比，本文提出的调度策略可使得Spark批处理应用达到软实时要求的比例、内存资源利用率和CPU资源利用率平均高出25％、32.5％和23.9％。收起

关键词 : Spark 混部技术作业调度

3. 基于Hadoop的MapReduce作业调度系统的研究与应用

[学位论文] 吴俊南京邮电大学 2016年硕士导师: 陈春玲共67页

摘要 : Hadoop是近几年发展起来的专为处理大数据的平台，是开源分布式数据处理框架，在处理大数据方面具有可靠性、可伸缩性、高效性、可扩展性、低成本等优点。MapReduce作为Hadoop的作业调度系统，它采用了分而治之的思想，同时采用具有开创性的设计思路来... 展开

关键词 : Hadoop作业调度系统吞吐量完成率最有效序列作业调度算法

4. 若干并行车间作业调度问题研究

[学位论文] 金茹燕浙江理工大学 2018年硕士导师: 董建明；胡觉亮共54页

摘要 : 并行车间作业调度问题源于大数据云计算领域，是近几年调度问题研究中的一个热点问题.本文主要针对并行车间作业的调度问题进行研究，研究的重点是问题的近似方案设计和最坏情况界分析.本文研究了m个并行k阶段自由车间作业调度问题，分别考虑了k=2和k... 展开并行车间作业调度问题源于大数据云计算领域，是近几年调度问题研究中的一个热点问题.本文主要针对并行车间作业的调度问题进行研究，研究的重点是问题的近似方案设计和最坏情况界分析.本文研究了m个并行k阶段自由车间作业调度问题，分别考虑了k=2和k为任意值情形下的问题;研究了并行两阶段流水车间作业调度问题，考虑了并行的流水作业车间数为问题的输入情形下的模型.全文共分五章. 第一章首先简要介绍了调度问题的一些基本概念以及相关预备知识，接着论述了并行车间作业调度问题模型的相关研究成果. 第二章主要研究m个并行两阶段自由车间作业调度问题.在该问题中，每个工件都有两道自由作业工序，每个工件需要在m个并行的两阶段自由车间作业中选择一个进行加工，并且每个工件在加工过程中不允许中断，目标是极小化最后完工工件的完工时间.用三参数法表示为Pm(O2)‖Cmax.针对该问题，本文给出了一个完全多项式时间近似方案(FPTAS). 第三章主要研究m个并行k阶段自由车间作业调度问题.在该问题中，每个工件都有k道自由作业工序，每个工件需要在m个并行的k阶段自由车间作业中选择一个进行加工，并且每个工件在加工过程中不允许中断，目标是极小化最后完工工件的完工时间.用三参数法表示为Pm(Ok)‖Cmax.针对该问题，本文给出了一个多项式时间近似方案(PTAS). 第四章主要研究并行两阶段流水车间作业调度问题.在该问题中，每个工件都有两道流水作业工序，每个工件需要在任意个并行的两阶段流水车间作业中选择一个进行加工，这里并行流水车间的个数是问题的一个输入.并且每个工件在加工过程中不允许中断，目标是极小化最后完工工件的完工时间.用三参数法表示为P(F)‖Cmax.针对该问题，本文给出了一个多项式时间近似方案(PTAS). 第五章总结全文并提出相关问题进一步的研究方向. 收起

关键词 : 并行车间作业调度动态规划

5. 集群系统作业调度优化技术研究与实现

[学位论文] 赵姗西北工业大学 2006年硕士导师: 周兴社共57页

摘要 : 集群计算系统具有低成本、高性能的特性，提供了强大的批处理和并行计算能力，代表了高性能计算机发展的主流方向。在该类系统中，通过提高硬件性能并不能完全满足用户复杂多样的要求，尤其是不能满足大规模科学计算和商业应用的要求，还需要对计算资... 展开

关键词 : 集群计算作业调度集群作业管理资源匹配算法作业调度算法

6. 用基于共生遗传算法的学习框架求解柔性作业调度问题

[学位论文] 许化强山东大学 2007年硕士导师: 邱洪泽共52页

摘要 : 车间作业调度问题(JSP)是许多实际问题的简化模型。寻找求解JSP问题的有效途径是调度和优化领域的重要课题。但是车间作业调度问题是NP难解问题，寻找具有多项式复杂度的算法几乎是不可能的。遗传算法是一种全局随机搜索算法，已经广泛的用于求解JSP问... 展开车间作业调度问题(JSP)是许多实际问题的简化模型。寻找求解JSP问题的有效途径是调度和优化领域的重要课题。但是车间作业调度问题是NP难解问题，寻找具有多项式复杂度的算法几乎是不可能的。遗传算法是一种全局随机搜索算法，已经广泛的用于求解JSP问题。它把JSP问题的可行解通过编码从问题的解空间转化到遗传算法能够处理的搜索空间。GA的遗传算子操作能够通过交叉或变异父个体生成新个体的方式来从解空间中搜寻最优解。 GA通过交换父个体中的基因片段或改变某些基因来进化进而完成搜索。如果在进化过程中，我们能够尽可能的保留父个体中具有较高适应度的优秀基因片段，并将其遗传到下一代中，那么GA可以在最有希望的解空间中搜索，进而可以提高搜索效率。本文中，我们通过用遗传算法对一个JSP实例多次求解，得到大量最优染色体编码串。经过认真分析，总结出代表问题特性的一些概念属性，并给出一个新的概念分级方法。基于这些属性及分类方法，应用数据挖掘算法从这些最优染色体编码串中学习知识，得到多组调度规则，仿真表明，这些调度规则可以有效的调度作业。调度规则也代表了这些最优染色体共有的特征。如果进化过程中在这些特征刚刚出现的时候，我们能够识别出来并将其遗传到后代个体中，显然可以改善后代种群的质量，进而可以提高搜索效率。在最后部分，借鉴上述思想求解具有操作柔性的车间调度问题。根据问题的特点，我们使用共生机制改进了遗传算法并将其集成到一个学习框架中。提出了相应的编码解码方法和一组自适应概率函数并改进了学习框架，使其在进化过程中可以学习染色体的优秀特征。我们把调度问题分为两个子问题，分别生成两个不同类的种群，相互影响，共同进化，将两个种群中的最优染色体结合起来解码则可以得到最优调度。进化过程中，学习模块可以不断从当前种群的适应度最高的一些染色体中学习其优秀特征，并指导后代个体的进化。最后我们给出了仿真实验，结果表明这种方法在解的质量上有山东大学硕士学位论文一定程度的提高。收起

关键词 : 作业调度遗传算法共生机制

7. 大数据作业调度优化模型及算法研究

[学位论文] 万聪东北大学 2015年博士导师: 张景中共122页

摘要 : 随着科学技术的发展，计算机以及互联网通过多种多样的方式在影响着人们的生活和工作。随着这种影响的深入，在日常生活和工作中积累下的数据也呈现出几何数量级的增长。这些数据是一笔宝贵的财富，对数据的分析可以更好的帮助人们了解用户行为和制定... 展开随着科学技术的发展，计算机以及互联网通过多种多样的方式在影响着人们的生活和工作。随着这种影响的深入，在日常生活和工作中积累下的数据也呈现出几何数量级的增长。这些数据是一笔宝贵的财富，对数据的分析可以更好的帮助人们了解用户行为和制定商业决策。大量的数据分析任务对计算资源的数量和分配也提出了挑战。云计算可以整合并管理大量的计算资源，成为了任务处理的基础设施。新的计算模型可以利用云计算提供的资源，高效的对海量数据进行处理。例如，Google提出的MapReduce模型在大数据的批处理计算方面优势明显，屏蔽了并行计算的底层细节，让开发者可以更加专注于算法的业务逻辑。在大数据条件下进行作业调度，具有待处理的数据量大，计算资源地理位置分布，计算模型新，对经济指标要求高等特点。本文针对以上特点，围绕作业调度的问题进行了研究。论文的主要工作有: (1)针对MapReduce模型中reduce阶段负载不均衡的问题进行研究。原有MapReduce模型中对数据分区和reduce任务进行了绑定，当数据分区大小不平均或者结点计算能力不同时，会造成负载不均衡的问题。本文建模分析了数据量、算法和计算能力等各个因素对reduce任务完成时间造成的影响，提出了一个负载均衡的MapReduce框架，增加了分区的数量，用采样的方法预测每个分区的大小，结合实际运行时各个结点的计算能力，动态的对分区进行分配，确保各个结点负载均衡，缩短了整个作业的运行时间。 (2)针对MapReduce作业调度中缺少对于成本的关注的问题进行研究。使用云平台进行大数据处理的一个关键原因就是对于成本的重视，提供MapReduce作为商业服务已经是一种趋势，目前的MapReduce调度算法还主要关注于作业的运行时间。本文提出了将运行时间和成本作为用户服务质量的两个属性。建立了以运行时间和成本为优化目标的MapReduce作业调度模型，分别使用博弈论和遗传算法对模型进行了求解。本文在Hadoop系统中实现了调度器，当多个用户同时使用Hadoop服务时，调度器会根据用户对时间或者成本的偏好来分配相应的资源数量，使所有用户的满意度达到最大。 (3)针对MapReduce中对不同优先级用户分配资源数量的问题进行研究。在同一个集群中，需要保证不同优先级别的用户对于作业截止时间的不同要求。本文提出了一个基于排队网络的多优先级作业调度算法(MPSA)。本文将MapReduce中的map阶段的资源和reduce阶段的资源抽象为两个服务站，总结了MapReduce算法使用两个服务站的三种模式。采用Jackson排队网络对基于MapReduce模型的算法建立了数学模型，应用该网络模型可以求出不同优先级队列对资源的需求。算法在用户到达率和任务规模变化的情况下，可以有效的满足不同优先级用户的截止时间限定。 (4)针对在地域分布的数据中心中进行数据密集型工作流调度的问题进行研究。在大数据条件下，进行数据迁移的工作量并不低于进行数据分析的工作量，而且使用带宽也需要支付相应的费用。本文在建立工作流模型的过程中，将数据迁移也映射为工作流的子任务，用有向无环图对工作流进行建模并化简。利用模拟退火算法，将工作流执行时间和花费作为优化目标，计算出一个优化的调度方案。上述研究都是围绕着大数据作业调度的优化而展开的，所获得的研究成果提高了MapReduce模型的性能和用户服务质量，对大数据作业在云计算中的使用做出了有益的贡献。收起

关键词 : 大数据作业调度优化模型

8. 云计算环境中高能效资源分配方法的研究

[学位论文] 侯泓颖东北大学 2013年硕士导师: 宋杰共81页

摘要 : 目前，云计算技术已经拥有了很高的成熟度。随着云基础设施的大量增加及云计算规模不断扩大，IT资源耗电量剧增，这极大阻碍了IT行业的发展。能耗已经成为制约云计算发展的重要因素。在这样的背景下，如何降低云计算能耗，提高云计算能效成为了研究的... 展开目前，云计算技术已经拥有了很高的成熟度。随着云基础设施的大量增加及云计算规模不断扩大，IT资源耗电量剧增，这极大阻碍了IT行业的发展。能耗已经成为制约云计算发展的重要因素。在这样的背景下，如何降低云计算能耗，提高云计算能效成为了研究的新难题。能效为单位能量完成的有效任务，对于同一任务，执行过程中消耗的能耗越少，能效越高。资源分配问题是高能效云计算领域的关键技术所在。但是目前大多数云计算作业调度算法的重心都放在作业调度上，而没有考虑资源分配与能耗。因此，在调度作业时，需要一个能效可感知的资源分配方法为作业分配合理的资源，进而提升集群的资源利用率与能效。本文提出了资源等待能耗和资源比的概念，并认为基于资源比的资源分配是平台软件层面提高能效的有效手段，该方法具有一定创新性。本文定义资源空闲时间消耗的能源为等待能耗，称等待能耗为0时，任务需要的资源量的比值为任务的最佳资源比，称为Map/Reduce任务分配运算和存储资源的过程为资源分配。首先，本文提出了任务的阶段模型，给出了通用的任务资源比模型。然后，基于MapReduce编程模型，本文研究了Map/Reduce任务对资源的占有特征，对Map/Reduce任务进行阶段划分和聚合，给出了Map/Reduce任务资源比模型。基于该模型，本文提出了一种高能效资源分配算法R2，主要包括任务调度和资源分配两个方面。最后，基于Hadoop集群环境，本文进行了一系列实验。首先，本文验证了最佳资源比的存在以及资源比和等待能耗的关系;接着，通过实验验证了Map/Reduce任务划分的合理性;然后通过实验数据对比验证R2算法能够明显减少资源等待能耗，提高节点资源利用率，进而优化Map/Reduce任务的能效。本文提出的资源比模型和资源分配方法可以应用于现有的MapReduce系统中，对高能效云计算中能效模型和优化有一定的理论意义和实际应用价值。收起

关键词 : 云计算作业调度资源分配方法

9. 云计算环境下基于优先级与可靠度的Hadoop作业调度研究

[学位论文] 谷连军湖南大学 2013年硕士导师: 李仁发共70页

摘要 : 近年来，云计算因其高性能、高可靠、可扩展等特点在海量数据计算中得到了广泛应用。在信息技术飞速发展的条件下，海量数据处理成为计算机科学领域的新挑战。MapReduce作为一种新兴的分布式计算模型，它的主要特点在于封装开发传统并行分布式程序的细... 展开近年来，云计算因其高性能、高可靠、可扩展等特点在海量数据计算中得到了广泛应用。在信息技术飞速发展的条件下，海量数据处理成为计算机科学领域的新挑战。MapReduce作为一种新兴的分布式计算模型，它的主要特点在于封装开发传统并行分布式程序的细节，实现业务逻辑程序的编写与分布式实现细节的分离。Hadoop作为MapReduce计算模型的开源实现，得到了各界的广泛关注，Hadoop调度算法主要克服的是集群资源利用率，用户作业的运行时间等难题。云环境下Hadoop作业调度的研究给学术界和工业界带来了新的挑战。改进和提高作业调度能力，对提高Hadoop的性能和资源利用率具有重要意义。首先，介绍了云计算的概念以及体系结构，对开源平台Hadoop中的MapReduce编程模型和分布式文件系统HDFS(Hadoop Distributed File System)进行了深入研究，详细分析了Hadoop作业运行时机制以及现有的调度算法。其次，针对基于优先级的加权轮转调度算法没有考虑系统负载水平，同时不能充分利用异构集群中计算节点的处理能力的问题，提出了一种改进的优先级调度算法(Priority Based Multi Scale，PBMC)，PBMC算法对集群中的计算节点的计算能力进行判断，并按照计算能力的不同进行排序，考虑系统整体的负载水平，在保证系统整体负载处于合理状态时，将优先级较高作业中的任务分配给计算能力好的节点。实验结果表明PBMC算法充分考虑了集群中节点性能的不同，减少了集群作业的完成时间，进一步提高了集群资源的利用率。最后，通过对云计算的开源平台Hadoop调度算法进行深入研究，针对用户提交服务的随机性、趋同性以及云计算系统的可靠性和集群资源的利用率的问题，利用排队模型建立云计算系统模型，采用集群中节点负载值来划分计算节点的可靠度。在对节点可靠性分类的基础上，提出了一种基于计算节点可靠度的Hadoop作业调度算法（Job Scheduling Based on Node Reliability，JSBNR）。JSBNR提出了一种计算节点可靠度评估模型，进而推出节点与任务的匹配方法。通过实验表明JSBNR提高了集群的可靠性以及资源的利用率，同时，具有良好的可扩展性能。收起

关键词 : 云计算 Hadoop平台作业调度集群资源

10. 铁路客车配件类产品生产计划与调度问题研究

[学位论文] 陈明哈尔滨工程大学 2010年硕士导师: 王能建共69页

摘要 : 随着产品创新的步伐加快,铁路客车配件类产品的生产模式已转变为多品种、中小批量生产方式。该类产品生产工作的核心就是铁路客车配件类产品生产企业按铁路客车生产企业安排的生产任务,按时、保质地完成配件类产品的生产。主要的工作内容是:(1)生产计... 展开

关键词 : 生产计划作业调度遗传算法