分类目录归档:研究内容(课题)

软件定义的云计算度量与评测

针对传统云平台面向用户体验尾延迟的可度量性弱,度量方法局限于底层资源,缺乏度量指标关联性分析等问题,本课题拟基于超图理论来构建面向资源状态,用户标签及软件定义策略等多维度的度量空间。以此实现面向尾延迟的可用性度量和审计追溯。课题中,首先研究面向资源状态,用户标签体系结构及软件定义管控策略的度量与评测理论;其次,在理论模型与算法基础上,深入探讨多维度量空间的构建方法;最终,建立面向软件定义云计算的标准化度量与评测体系,构建相关评测软件工具。预期目标是形成一套完整的度量与评测理论、方法、软件及标准提案。

软件定义的云计算资源管理

本课题研究目标是研究出一套针对软件定义云计算基础设施和软件定义资源平台环境的高效资源管理与任务调度理论、模型与方法,达到用户服务响应时间、服务提供商效益、和平台提供商效益等多个目标的最优;开发出一套软件定义云计算平台的资源管控软件原型,用于验证所研究的理论、模型与方法。

软件定义网络

针对现有数据中心网络的一维“管道”模型所导致的抽象粒度粗、无法有效解决网络传输尾延迟的问题,研究从应用、协议栈到数据通路的统一多维网络资源抽象方法和管理机制,从而实现网络协议和拓扑从不可定义到可定义的转变。研究云计算环境下虚拟网络向物理网络的高效映射方法,在满足租户的虚拟网络资源请求的前提下提升物理网络资源的利用率,与传统方法相比利用率提升 1 倍以上。研究满足高效灵活映射的云计算网络交换架构、控制平面及数据平面。提出新的数据中心互联网络 CLHR 使得网络成本较现有相应 Cray,IBM 公司商用系统降低 10 倍。提出 CLHR 对应的高性能路由算法,流控技术,死锁消除机制;提出 CLHR 网络的高效的组播及广播算法,不需要修改路由器体系结构。

软件定义的可重构分布式存储系统构建原理与方法

共享云场景下,使用面向单一应用(文件存储,键值存储等)构建的专用存储系统。无法提供共享云所需的多样化数据访问模式(文件、键值、块、对象等),只能通过单独部署多个专用存储系统支持共享云所需的多样化存储服务,导致存储资源无法共享,存储资源利用率低。另一方面,存储软硬件系统资源共享后,由于租户间性能干扰,导致存储系统面临尾延迟问题。

本课题针对上述问题,定义分布式存储系统的功能性语义抽象与QoS保证语义抽象,提出微服务化的统一存储系统构建方法,包括存储微服务边界划分、接口规范、交互机制与适配方法,支持访问接口与存储服务动态可重构。另一方面,针对共享云多租户差异化QoS需求,本课题进一步采用标签化机制在统一存储系统上保证QoS需求,提出存储设备开放接口和层次化软硬件协同机制传递标签,实现IO全路径上多租户性能隔离;提出基于用户需求标签和存储系统主动感知相融合的方式构建按需适配的数据去重技术,减少存储空间和能耗,提升存储系统效能。

软件定义标签化体系结构原理与方法

本课题围绕云计算面临的尾延迟、低效率、高干扰三个问题,从理论模型、体系结构两个方面开展研究,预期实现以下研究目标:(i)针对尾延迟现象开展深入研究,提出“实用可计算性理论”,刻画面向云计算真实场景的实用可计算性理论,凝练出若干条指导云计算应用开发、架构设计、系统优化的根本法则;(ii)提出面向云计算应用场景的“标签化冯诺依曼体系结构LvNA(Labeled von Neumann Architecture)”,通过全路径标签化机制与软件定义策略管理,在云计算多租户环境下实现应用全生命周期海绵式云计算资源管理,数量级降低应用尾延迟,提高资源利用率;(iii)提出面向LvNA 标签化体系结构的资源显式编程模型与编程方法。上述理论预期产出系列高水平论文,在国际上形成影响力。

在理论研究的基础上,本课题将研制支持LvNA体系结构的原型系统,包含16个自主研制的云服务器节点。每个节点采用一颗自主研制、支持软件定义体系结构的SoC芯片,一些性能攸关的资源如共享Cache、内存带宽、I/O带宽等可在应用执行过程中由软件动态调节。16节点原型系统可部署云管控软件,支持多租户同时运行在线服务型应用与离线分析类应用。本课题目标是原型系统能在满足在线服务型应用的响应时间要求前提下,实现所有节点平均CPU利用率达到60%以上,预期达到世界领先水平。

本课题研究成果对未来云计算数据中心的性能提升、成本降低、绿色节能等需求提供有力的理论与技术指导,通过与国内互联网、云计算企业合作,部分研究成果有望应用到这些企业未来数据中心的设计中,有利于推动云服务相关产业发展与进步。