系统管理控制器演变成了控制平面

2016 年 4 月 24 日

罗恩 · 威尔逊先生,Altera / 英特尔看作为系统管理控制器如何变化的处理要求承担更多的任务。

系统管理控制器将实现如果不是几十年来的功能蔓延起来非常简单。

什么开始作为单个任务的简单经理认为控制在机架中的冷却风扇热敏电阻-已经变得复杂嵌入式系统处理的任务,包括物理监测和控制、 远程配置管理、 工作负载管理、 虚拟化、 可靠性和安全的投资组合。

上述每个任务已变得越来越复杂。例如,随着 CPU 板中添加多个 Soc 和 DRAM Dimm 开发热问题,温度测量开始要求多个传感器和单片机 (MCU)。一旦你添加了单片机,你也可以使用其脉冲宽度调制输出控制风扇驱动程序。功能蔓延正在进行中。

已有类似进展电压监测,它最初是指保持重置直到 VCC 内规格,并主张 ‘停电’ 如果它又不符合规格的 CPU。但然后 Soc 开始也需要与不同的公差和有时严格电顺序的多个电源轨。IC 制造商开发混合信号电源管理控制器来处理这些任务,虽然一些系统设计器加载他们现有的单片机上。

进一步发展,动态电压频率缩放,就意味着控制器有可能改变电源电压和时钟频率域内实时,SoC 冻结时钟级直到新供应的稳定。再次,可以由专用的芯片或系统管理单片机处理任务。一些系统已经成为如此微妙,传感器必须捕获电压波形或谱,不只是定期的液位测量,并将它们传递到控制器通过 I2C 总线类似。

一连串的问题

电池管理,特别是对于移动设备,进一步介绍系统管理方面的挑战。现代电池提供体面的能量密度、 循环寿命换取包括不透明度对他们真正的掌控水平、 负载和温度敏感性和灾难性失败的可能性,如果虐待的行为问题。

管理这种细胞可以涉及高度精确的电压和电流监测、 复杂的状态估计算法,如卡尔曼滤波器、 负载平衡算法和电流开关内电池组充电和操作期间使用。再次,这一切可以处理由专用的电池管理控制器或在日益沉重的系统管理控制器内。

大型系统还需要捕获和报告其他物理测量,如风扇速度、 内阁入侵和热插拔事件。有其他事件,如错误标志的 Dimm 和 Soc,需要将被纳入系统管理战略,太。

远程访问

在小、 自治系统中,可以本地处理本文所有的监测和控制。但更复杂的系统需要能够登录常规数据,报告异常,并接受来自远程的上司的命令。为此,很多主板管理控制器有一个通信协议栈和远程连接。这可以是一个简单的串行端口或多今天经常上板的系统接口,单边带连接是这个 PCI Express (PCIe) 或以太网。此边带端口必须继续工作,即使董事会 CPU 处于禁用状态。

很多关于网络的董事会管理工作已经由标准组织,如 PCI 工业计算机制造商集团 (PICMG),创作者的先进电信计算架构 (ATCA) 规范,或由戴尔、 惠普等数据中心服务器的开发人员。他们看到一个网络的董事会管理处理器为根本,以大型开关和计算系统的操作和使用的网络连接生成一个控制平面计算或切换硬件 (图 1)。

系统管理控制器演变成了控制平面

图 1。连接和冗余使原本孤立的微控制器,以成为一个功能强大的系统管理功能的高可靠性网络一套 (来源 ︰ Altera)

此网络带来机会超越传感器测井。例如,您可以发送所有记录的数据到一个大数据分析系统,以预测故障。你可以使用网络来启用远程固件更新,通过主板管理控制器写访问权限给委员会的快闪记忆体。[PICMG 标准接口为此提供-至少为董事会-通过硬件平台管理接口的单片机固件。]并且您可以访问 CPU 通过董事会管理端口,几乎将附加的 CDROM 驱动器或控制台键盘,显示器,鼠标,或提供 CPU 状态更新通过串行输出。所有的信息都是打包和转达对以太网边带。这使外部设备来监视和控制操作系统甚至应用程序活动。

控制平面

在网络中交换设备,功能通常被分开的两套硬件之间。必须工作以线速-就像数据包缓冲的功能,在数据平面的专用的、 可配置硬件路由和优先排序 — — 就这样。监督职能-在软件上的 Cpu 控制平面中做如建设路由表和管理队列。

在服务器世界中,应用程序运行在数据平面中的服务器 Cpu 上。监督的功能,比如维护例程和配置管理-运行在一个虚拟化的控制平面中其他服务器 Cpu 上。两者之间的连接是网络,还管理内阁、 冷却和电力的董事会管理处理器。

日益紧张的局势

更有能力董事会管理处理器成为,更诱人它是要给予他们多快节奏的本地配置和应用程序分配决定的权力。但更多的力量设备,他们将成为攻击的目标,风险越大。

甚至在很多较小的系统,安全是一个主要的问题。例如,身份验证和加密是必要的-即使在单板系统-确保局经理固件更新是安全的。

对于设计师在军事和交通系统,这种情况下可能听起来很熟悉。我们描述一个物理上独立的可以监视两个物理量的处理器网络和应用程序代码执行。这个网络可以帮助分配资源,以及管理关键任务的失败。在通信或计算,我们可以谈论系统管理硬件。在军事或运输设计中,我们将谈论功能安全子系统。

这种任务关键型系统有时使用单独的、 高可靠性的硬件来检查系统,监测外部环境,为这个系统可能造成的风险做伤害-说,超过安全速度对铁路段-和进行干预的状态。

有很多的冗余,以确保即使在硬件出现故障时在较大的系统,这些功能安全任务经常分组与上主 Cpu 的应用程序任务,功能安全任务仍然在时间上发生。但有优势,运行功能安全任务在简单、 孤立的环境中,它可能证明正式断言关于代码的执行。

未来的系统管理

当今最先进的系统管理处理器是成为一个复杂的控制平面通信大屋和计算服务器。但我们怎么在这里?

有点嵌入式控制回路成为一个多输入的数据记录器。它获得了一个网络接口和远程更新和控制台的能力。它开始监控软件执行,并获得操作系统。也许它开始工作与系统管理程序来管理虚拟机。于是我们到今天我们在何处。

在系统管理会发生什么?随着它就有了更多的功能,变得更加广泛和深入的网络,它将成为对攻击者越来越有吸引力。为了减轻这,我们可能会看到越来越多地使用高可靠性硬件、 冗余策略和加密处理,以保护什么将成为关键控制飞机为大量的通信和计算资源。也许,在时间,系统管理子系统将也开始借钱从其他学科,如汽车的设计,并开始承担一些责任的关键基础设施大部分的功能安全。

它是从一个热敏电阻、 风扇和机架很长的路。

相关新闻