本书内容聚焦于资源侧:集群调度和管理,非一般性的应用集群调度和管理。本书按集群调度和集群管理两大部分来组织内容,从不同的侧重点出发,集群调度部分侧重调度,集群管理部分侧重管理,但实质上这两部分是相辅相成的。集群管理是为了保障集群系统被更好地调度,集群调度是集群管理的重要内容和抓手。本书内容主要包括:集群任务与集群资源调度、资源调度领域的本质问题和衡量指标、调度算法的基本原理、调度架构设计和实践、集群管理的问题抽象、管理问题的衡量、管理策略等。本书内容源于作者在阿里巴巴集团内部的资源调度和管理的实践经验,同时作者也广泛阅读了网络上的相关技术文档、开源代码。

作者

李雨前,最近从事阿里云ECS弹性计算产品售卖、产品运营推荐、库存供应等工作,有4年的大规模(阿里巴巴百万级容器)集群资源管理调度实践经验:包括经历和推动多个调度核心系统和模块,针对long-time service及 co-location 调度具有全面、深入的一线实践和解决问题经验,提交10+项相关发明专利;擅长稳定性优先的集群调度策略和稳定性架构设计、全局稳定性数据分析实践,以及Java和Go编程语言。信息检索科班毕业: 1. 超过7年的信息检索学习、研发经验,多项相关发明专利;2. 对信息检索,特别是基于lucene、solr的全文检索有深入、全面的掌握(负责研发管理最大搜索集群120亿记录、16TB索引)。3. 一直对分词、个性化排序、短文本处理,有浓厚的兴趣,并在多个业务实践中得到发挥。

查看全部
目录

作者简介

内容简介

前言

注释

第1部分 集群调度

第1章 集群任务与集群资源调度

第2章 资源调度核心指标

第3章 基本调度算法

第4章 资源调度架构设计和实践

第2部分 集群管理

第5章 集群资源管理含义

第6章 集群资源管理核心指标

第7章 集群资源管理常用策略

参考资料

附录A

查看全部
书评
查看更多
请您登录后发表评论 登录 | 注册
我的评分:
提交
0/400