利用Oracle大数据服务构建您的Data Lake

发布于:2020-12-24 16:15:28

0

90

0

Oracle Data Lake 数据库

在当今世界,越来越多的来自各种来源的高度多样化的数据泛滥成灾。在管理和组织该数据的斗争中,从业人员发现仅将传统的关系数据库或数据仓库作为选项时,会遇到困难。

这就是为什么数据湖作为对传统数据管理的补充而变得越来越受欢迎的原因。可以将传统的数据仓库视为一个存储库,可以清洗,饮用。

另一方面,数据湖中的数据可能具有未知的价值。数据不一定要清理,这就是为什么它更像是一次冒险。数据湖可能非常庞大,充满了数据和无与伦比的可能性。用户可以轻松地加载更多数据,并开始尝试寻找组织以前无法发现的新见解。

组织必须能够:

1.以不那么复杂的方式存储他们的数据

2.即使数据更复杂,也可以减少管理

3.以对他们有意义的方式使用数据

这正是Oracle创建Oracle大数据服务作为帮助构建数据湖的一种方式的原因。

Oracle大数据服务是一项基于Cloudera Enterprise的自动化服务,可提供具有成本效益的Hadoop数据湖环境-一个安全的地方,用于存储和分析来自任何来源的不同类型的数据。它可以用作数据湖或机器学习平台。

它带有一个完全集成的堆栈,其中包括开源和Oracle增值工具,并且是为需要灵活的部署选项,可伸缩性和添加所选工具的能力的企业设计的。

Oracle大数据服务还提供:

 1.一种从内部扩展到Oracle Cloud的简便方法

 2.数分钟内即可获得安全,可靠且灵活的Hadoop集群

 3.与Oracle Cloud平台服务的本机集成

千万不要错过有关大数据的更新! 订阅大数据博客 ,直接将最新帖子直接发送到您的收件箱!

Oracle + Hadoop =更好的数据湖

我们希望向您提供Hadoop和整个Hadoop生态系统的功能。但是Hadoop可能很复杂,这就是为什么我们将Oracle和Cloudera所提供的最好的东西结合在一起,并使它变得更易于处理,这比以往任何时候都更容易构建和管理数据湖。

借助Cloudera Enterprise Deployment,我们的服务将以最佳实践,高可用性部署垂直集成到Hadoop,Kafka和Spark。

借助大数据服务,您可以获得:

1.数分钟内即可配置的高度安全,高可用性的群集

2.扩展本地Hadoop的能力,使您能够将数据湖部署,测试,开发和/或移动到云中

3.使用高性能裸机或经济高效的虚拟机形状,可以灵活扩展规模

4.自动部署的安全和管理功能


您还可以选择您的Cloudera版本,从而使您能够:

1.匹配您当前的部署-这对于测试和开发环境很重要

2.部署新版本-使您能够利用发行版的最新功能

Oracle大数据服务功能

我们将Oracle大数据服务构建为您的大数据和数据湖解决方案,该解决方案专门针对各种大数据用例和工作负载而设计。从用于处理特定任务的短命集群到管理大型数据湖的长命集群,Oracle Big Data Service可以以低成本和最高安全级别扩展以满足组织的需求。

让我们探讨一下Oracle大数据服务如何做到这一点。

1.Oracle大数据服务和Oracle Cloud SQL

使用Oracle SQL通过Oracle Cloud SQL跨大数据源进行查询,包括Hadoop分布式文件系统(HDFS),Hive,对象存储,Kafka和NoSQL。

您可以通过简单的管理来完成所有这一切,因为Oracle Cloud SQL使用现有的Hive元数据和安全性,并使用Oracle Cloud SQL计算提供快速的横向扩展处理。

2.Oracle大数据服务和大数据分析

如果您无法运行分析来查找实际结果,那么管理和访问数据有什么用?我们在机器学习,空间分析和图形分析领域提供支持,以帮助您获取组织所需的信息,以获得更好的业务成果和改进的指标。Oracle大数据服务客户已获得这些选项的许可,并且可以免费部署。

连接到Oracle Cloud服务(例如Oracle Analytics Cloud,Oracle Cloud Infrastructure Data Science或Oracle Autonomous Database)也很容易。或者,您可以将任何经Cloudera认证的应用程序用于各种分析工具和应用程序。

3.Oracle大数据服务和工作负载可移植性

云可能是企业计算的未来,这就是为什么我们使用Oracle Cloud Infrastructure构建了最新,最好的云基础架构的原因。但这还不是全部-至少现在还没有。在可预见的将来,您仍然需要维护公共云,本地云和传统本地计算的混合。

借助Oracle大数据服务,在合理的位置进行部署。使用Oracle,如果您在内部开发某些东西,则很容易将其转移到云中,反之亦然。

4.Oracle大数据服务和安全的高可用性集群

使用Oracle Big Data Service,在创建集群时可以轻松部署。指定最小设置以创建集群,然后仅需单击一下即可创建具有高可用性Hadoop服务的集群。

您还可以选择Cloudera版本,从而启用“也可以云”部署以匹配本地兼容性,或者可以选择较新的版本以利用最新功能。

5.Oracle大数据服务提供安全性

如果您使用的是现成的虚拟化,则Oracle无法看到客户数据,而客户也无法看到Oracle管理代码。在大多数第一代云中,网络和租户环境是耦合的,仅由管理程序抽象。

Oracle遵循最小信任设计原则。我们不信任硬件,客户(认为是流氓员工)或管理程序。这就是为什么我们将网络和租户环境分开的原因。隔离网络虚拟化有助于防止攻击的扩散和横向移动。

此外,借助Oracle大数据服务,所有Cloudera安全功能都可以通过强大的身份验证,基于角色的授权,审计和加密来启用。

6.Oracle大数据服务以及所需的计算和存储

无论您是使用Oracle Big Data Cloud进行开发,测试,数据科学还是数据湖,我们都会为您提供用例所需的计算产品。利用虚拟机(VM),块存储以及直接连接的NVMe(非易失性内存快速)存储的灵活性,裸机具有无与伦比的性能。

7.Oracle大数据服务和高级网络

借助Oracle大数据服务,您可以期待高保真度,虚拟网络和连接性。我们的网络是可订制

1.完全可配置的IP地址,子网,路由和防火墙,以支持新的或现有的专用网络高性能和一致

2.高带宽,微秒级延迟网络

3.无需遍历互联网即可进行私人访问能够连接到公司网络

4.FastConnect-专用的专用连接

5.VPN Connect-简单安全的互联网连接


8.Oracle大数据服务和Oracle数据管理平台

您的组织花费时间和精力来创建,获取和存储数据,并且您希望能够使用它。您可以使用Oracle减少从源头到整个企业所需的所有位置获取数据的时间,成本和工作量。

Oracle花了数十年的时间建立和扩展其数据管理平台。

借助Oracle的端到端数据管理,您可以轻松连接到:

1.Oracle自治数据库

2.Oracle分析云

3.Oracle云基础架构流

4.Oracle云基础架构数据目录

5.Oracle云基础架构数据科学

6.Oracle云基础架构数据流

7.清单继续...


借助Oracle Cloud SQL的统一查询,您将能够使用Oracle SQL关联来自各种来源的信息。此外,您还将获得许多Oracle分析和连接选项,包括:

1.Oracle机器学习

2.Oracle大数据空间和图形

3.Oracle大数据连接器

4.Oracle Data Integrator企业版

满足您所有数据湖需求的Oracle大数据服务

从启用机器学习到存储和分析数据,Oracle大数据服务是一种可扩展的安全数据湖服务,可以低成本和最高安全性满足您的要求。

它使您不必担心管理和存储数据。它使您能够以一种使组织的未来比以往任何时候都更成功的方式开始分析数据。

要了解有关如何开始使用数据湖的更多信息,请搜索相关内容或留下你的评论。