(相关资料图)
有些人认为边缘计算是数据采集或本地数字过程控制的一种美化形式。然而,边缘远不止这些。
边缘涉及许多数据源,通常位于地理分布的位置。但请记住,这些数据的聚合是价值和洞察力的关键。对这些数据的分析发生在核心数据中心,并且通常需要在边缘位置完成由所得见解指导的行动。这意味着边缘系统面临的一个令人惊讶的挑战是不仅从边缘到核心的高效流量,而且还可以再次返回。
这一切发生的规模也是一个问题。边缘源的传入数据通常非常大;来自大量边缘位置的大量数据可以创建真正大量的数据。
处理边缘计算极端规模的一个典型例子是自动驾驶汽车的开发。汽车制造商需要访问全球数据,每天处理数 PB级的数据。他们还必须满足关键的关键绩效指标 (KPI),包括衡量从测试汽车收集数据需要多长时间、处理多长时间以及提供洞察需要多长时间。
当然,并非所有边缘系统都涉及这种极端规模的数据,但大多数边缘情况涉及太多数据,无法将其全部从边缘传输到中心数据中心。这意味着在将数据发送到核心之前,必须在边缘处理和减少数据。这种类型的数据分析、建模和数据移动必须大规模有效地协调。
为了更好地理解边缘系统的挑战,让我们深入研究边缘、核心和中间发生的事情。
活动在边缘
边缘计算通常涉及多个位置的系统,每个系统都进行数据摄取、临时数据存储,并在传输到核心数据中心之前运行多个应用以减少数据。在图 1 的左半部分说明了这些任务。
图 1.边缘和核心需要做什么以及它们之间复杂交互的图形清单。
分析应用程序用于预处理和数据简化。人工智能和机器学习模型也被用于数据简化,例如决定哪些数据是重要的,应该传递给核心数据中心。此外,模型允许智能行动发生在边缘。另一个典型的边缘需求是弄清楚发生了哪些步骤以及创建了哪些数据文件。
所有这一切都必须发生在许多地方,没有一个地方会有大量的现场管理,因此边缘硬件和软件必须是可靠的和远程管理的。有了这些需求,自我修复软件就是一个巨大的优势。
训练 AI 模型等——核心
发生在核心的活动,如图1的右侧所示,类似于边缘过程,但具有全局视角,使用来自许多边缘位置的集体数据。这里的分析可以更加深入。这就是深度历史数据用来训练人工智能模型的地方。与边缘位置一样,核心包含已执行的操作和已创建的数据清单。核心也是与边缘系统目标之下的高级业务目标进行连接的地方。
核心数据基础设施必须满足具有挑战性的要求,因为来自所有边缘系统的数据都汇聚于此。来自边缘的数据(或来自核心处理和建模的数据)可能非常庞大,也可能包含大量文件。基础设施在处理大规模对象数量和数据量方面必须是稳健的。
当然,分析和模型开发工作流程是迭代的。随着组织从全球边缘数据聚合中学习,新的 AI 模型被生成和更新。此外,还开发了必须部署在边缘的分析应用程序。这就引出了下一个话题,即边缘和核心之间需要发生什么。
在边缘和核心之间移动的流量
正如图 1列出了边缘或核心的关键活动一样,它也显示了二者之间的关键交互:数据的移动。显然,系统需要将吸收和减少的数据从边缘位置移到核心位置进行最终分析。然而,人们有时会忽视一个意想不到的旅程:将新的人工智能和机器学习模型或更新核心团队开发的分析程序带回边缘。
此外,分析师、开发人员和数据科学家有时需要检查一个或多个边缘位置的原始数据。从核心直接访问边缘位置的原始数据非常有帮助。
几乎所有的大规模数据移动都应该使用数据基础设施来完成,但直接访问在边缘或核心运行的服务会很有用。安全服务网格对于这个过程很有用,特别是如果它们使用现代的零信任工作负载身份验证方法,例如SPIFFE 协议。
现在我已经确定了在边缘、核心和中间发生了什么,让我们看看数据基础设施需要做什么才能使这成为可能。
HPE Ezmeral Data Fabric:从边缘到核心再返回
HPE 以其出色的硬件而闻名,包括 Edgeline 系列(专为在边缘使用而设计)。然而,HPE 还生产与硬件无关的 HPE Ezmeral Data Fabric 软件,旨在从边缘延伸到核心,无论是在本地还是在云中。
HPE Ezmeral Data Fabric 可让您简化系统架构并优化资源使用和性能。图 2 显示了如何使用数据结构的功能来应对边缘计算的挑战。
图 2:深入了解HPE Ezmeral Data Fabric如何支持图 1 中列出的从边缘到核心再返回的操作和流程。三角形代表
计算可以在边缘或核心使用 Kubernetes 来管理容器化应用程序。HPE Ezmeral Data Fabric 为此类应用程序提供数据层。借助 HPE Ezmeral Data Fabric的全局命名空间,在数据中心工作的团队可以远程访问仍处于边缘的数据。
计算可以在边缘或核心使用 Kubernetes 来管理容器化应用。HPE Ezmeral Data Fabric 为此类应用提供数据层。借助 HPE Ezmeral Data Fabric的全局命名空间,在数据中心工作的团队可以远程访问仍处于边缘的数据。