进一步了解Google的春季数据和分析功能

正如Natalie Gagliordi今天上午在其报告中所报道的那样,Google宣布了三款新数据和分析服务的预览,这些新服务填补了其产品组合中的一些关键空白,解决了实时集成,数据共享和治理问题。通用线程是关于到本地和云中现有数据库的连接性,以及为Google的分析服务建立新的结构,这将为数据发现,安全性和治理提供通用的底板。

Google的公告符合我们目前与云提供商所看到的模式:随着他们的数据库管理和分析产品组合的不断完善,他们现在正在添加结缔组织。我们正在仔细研究Google的最新服务,包括Datastream,Analytics Hub和Dataplex。

数据流和DMS:自动化实时复制和数据库迁移

Google在本周宣布了Datastream的预览版,这是一种无服务器的变更数据捕获(CDC)和复制服务,它将把Oracle和MySQL数据库中的变更流带到多个Google Cloud目标中,包括BigQuery,Cloud SQL,Cloud Spanner和Google云端存储。更重要的是,尽管网络延迟会导致与Google Cloud外部源的滞后,但Google Datastream复制是实时的。

去年秋天宣布推出并于三月下旬全面推出的Google Cloud Database Migration Service(DMS),Datastream补充并共享了一些相同的基础技术。我们将在本节中对两者进行分析。

乍一看,很容易将新的Datastream服务与DMS混淆,因为两者都连接到Google Cloud外部的数据库;两者都是无服务器的;两者都使用类似的变更数据捕获技术;两者都可以自动进行配置(例如,连接设置),这些配置通常需要大量的人工工作才能进行配置。

但是用例有所不同:数据流用于持续的低延迟复制,例如用于实时分析或需要事件驱动的体系结构的应用程序,而DMS目前用于一次性迁移并将数据库迁移到Google Cloud的迁移。托管数据库(如下所述)。此外,尽管Datastream提供了异构支持,但DMS目前仅限于类似迁移:它支持从MySQL或PostgreSQL的任何实例,本地或Amazon RDS等源迁移到运行MySQL或PostgreSQL目标的Cloud SQL , 分别。 DMS通过使用MySQL和PostgreSQL的本机数据复制引擎来工作。