雪花数据仓库简介

在本教程中,我们将讨论什么是 Snowflake 数据仓库、Snowflake 架构、如何创建免费试用帐户以进行试驾,以及如何访问 Snowflake WebUI。

一、什么是雪花数据 Cloud 仓库?

Snowflake 是一个基于云的数据仓库平台 Cloud. 目前流行 Cloud Amazon Web Service (AWS)、Microsoft Azure 和 Google 等提供商 Cloud 支持雪花。

无需安装、配置或维护任何硬件(虚拟或真实)或软件,因为它完全在公共云基础架构上运行。 雪花是真的 软件即服务 产品。

Snowflake 提供的数据仓库模型比典型的数据仓库系统更快、更容易设置并且适应性更强。

由于其独特的特性,它迅速成为分析市场数据管理解决方案的佼佼者。

雪花 – 数据仓库

2.雪花架构

Snowflake 数据库设计是共享磁盘和无共享数据库系统的组合。 Snowflake 与共享磁盘系统一样,使用中央数据存储来存储数据,并且可以从平台中的所有计算节点访问。

Snowflake 使用 MPP(大规模并行处理)计算集群执行计算,其中集群中的每个节点在本地维护一个完整数据集的一部分,类似于无共享系统。

这种方法结合了共享磁盘设计的数据管理便利性与无共享架构的速度和横向扩展优势。

雪花建筑

雪花架构中有 3 层。

  1. 存储层,
  2. 计算层,
  3. Cloud 服务层。

让我们详细讨论每一层。

2.1. 存储层

Snowflake 将数据划分为无数个微分区,每个微分区都在内部进行了优化和压缩。 它以柱状方式存储数据。

数据保存在云中,并使用共享磁盘方法进行管理,使数据管理变得简单。 在 shared-nothing 架构中,这确保了用户不必担心数据在多个节点上的分布。

为了获取数据以进行查询处理,计算节点链接到存储层。 由于存储层是独立的,我们只需为每月平均使用的存储付费。

Snowflake 的存储是弹性的,因为它是在云中提供的,并且根据每 TB 的消耗量按月支付。

存储的定价由云提供商根据每月的存储利用率收取,这意味着存储成本是使用压缩后每月使用的平均存储量确定的。

2.2. 计算层

该层由可扩展计算单元的虚拟仓库组成。

计算层从存储层获取数据并将其缓存在本地以增强将来的查询结果,即每个虚拟仓库都有自己的缓存。

多个虚拟仓库可以同时运行,维护ACID,对数据执行多个并发处理。
在 Snowflake 中,可以根据工作负载构建多个虚拟仓库以满足不同的需求。

这些仓库本质上是 MPP(大规模并行处理)。 每个虚拟仓库都可以使用一个存储层。

虚拟仓库有自己的计算集群,不与其他虚拟仓库交互,即无共享架构。

该仓库的定价将采用动态方式,即,费用将根据您消耗了多少计算单位来计算,它将被计算为信用。

因此,每当数据仓库进行计算时,那时只有计费时钟会运行。 以下是不同数据仓库规模的计费计量。

虚拟仓库大小每小时学分
X-小1
小的2
中等的4
大的8
超大16
2X-大32
3X-大64
4X-大128
5X-大256
6X-大512

数据仓库 – 学分

此计费将按每秒使用次数进行。 最低收费为一分钟,即一旦数据仓库开始计算,最低收费将从一分钟使用开始计算。 为了 example,如果您只使用 30 秒,则充电时间为 1 分钟。

2.3. Cloud 服务层

该层包含在整个 Snowflake 中协调的所有操作,例如身份验证、安全性、加载数据的元数据管理和查询优化器。

服务层为DDL、DML等数据操作提供SQL客户端接口。 这种云服务也可以像其他层一样进行扩展。

为此定价 Cloud 服务不会直接收费。 默认情况下,会为 Cloud 服务,因为这些服务也需要计算能力才能运行。

当使用率超过每天使用的总计算量的 10% 时,将开始对云服务收费。 为了 example如果运算计算使用 100 个学分并且 Cloud 服务使用 15 个积分,则云服务的收费为 15 – (100 的 10%) = 15。

3.什么是信用?

信用是雪花中的充电单位。 每个学分的金额将根据版本和 Cloud 提供者。 您可以在此查看和估算价格 关联.

您可以选择 Cloud 提供者、地区和货币; 您将获得每笔信用的估计费用。

雪花定价雪花定价

4.创建雪花帐户

雪花提供了一个 免费试用 考虑试驾; 它是 使用价值 400 美元. 您可以在下面的链接中创建一个免费试用帐户。

在注册页面中,输入您的基本详细信息,然后单击继续。

雪花注册页面雪花注册页面

选择雪花版, Cloud 供应商和地区。 确保您已选中许可协议框,然后单击开始。

选择雪花版和 Cloud 提供者选择雪花版和 Cloud 提供者

一封确认邮件将发送到您注册的邮箱。

雪花注册完成雪花注册完成

转到您的电子邮件收件箱,打开来自 Snowflake 支持的激活邮件,然后单击“点击激活”链接。 您将被重定向到新的,您可以在其中设置用户名和密码。

雪花激活邮件雪花激活邮件

设置用户名和密码。 单击“开始”继续。

设置雪花帐户设置雪花帐户

开始后,您将收到确认邮件,说明您的帐户已被激活。 单击“登录到雪花”链接。

雪花账户确认邮件雪花账户确认邮件

您现在将被重定向到 Snowflake WebUI 的登录页面。

雪花网页界面雪花网页界面

结论

在本文中,我们了解了 Snowflake 的概念、架构,并开设了一个免费试用帐户,用于 POC 和测试目的。 我们还讨论了如何访问 Snowflake 的 WebUl。

我们将看到如何安装 SnowSQL,使用 SnowSQL (CLI) 访问 Snowflake,并将在下一篇文章中学习各种数据库管理活动。

  • 如何使用 SnowSQL CLI 客户端连接雪花

资源: