020-29815005
预约专线时间:09:00-23:59

数据库和数据仓库的区别

新闻来源:本站 日期:2021-07-02
从根本上说,当今的数据驱动商业环境需要快速而全面的分析。对很多公司来说,这意味着要把你的数据从众多不同的数据库(以及其他数据源/数据流)中迅速准确地转换成强大的基于云的数据仓库,可能会有一些转变。
    数据库概述

    对于如何处理所有数据,简短的回答是将数据放入数据库。资料库是资料解决方案的基础。这些数据必须存在于某处,对于大多数应用程序来说,它是数据库。这是一个有组织的数据集。典型地,要使用的数据库类型是OLTP(在线事务处理)数据库。

    然而,图片更多的是存储一个数据源或应用程序的信息。如今,企业是以数据为基础的,而OLTP数据库通常不善于对由许多数据源组成的大型数据集进行分析。当您开始从多个源收集越来越多的数据,并且需要转换和分析这些数据,可能会导致在多个OLTP数据库中存储来自多个不同源的数据,或者要跨多个数据库存储。单独分析每一个数据源并不有效,而且成本是最高的。

    你需要一个更好的位置来保存所有这些数据源的数据——这个位置让你可以同时维护所有数据源和数据流的单个存储库,并运行分析。


数据库


    数据仓库概览

    更好的解决办法是把数据集中到数据仓库里。实际上,数据仓库是一个数据库(或一组数据库)专门用于存储、过滤、检索和分析大型数据集合。该数据仓库是基于OLAP(在线分析处理)和专门用于分析的。现在的方法是把所有数据库(和数据流)的数据放在一个数据仓库中。这样,您就可以同时进行可视化和分析,而不必对较小的块进行多次可视化和分析,而无需合并或统一结果。

    针对数据仓库,选择内部部署和基于云的解决方案。本地数据仓库(比如Oracle、IBM、Teradata等)通常擅长于灵活性和安全性。当被管理的服务器或直接访问服务器时,可以对管理和配置有更好的控制。

    像AmazonRedshift,GoogleBigQuery,Snowflake等基于云的数据仓库提供了更高的可扩展性,以及更低的入门和维护成本。举例来说,仅在必要时启动(并已付款)额外的计算容量和存储空间。另外,资源总是可用的,这样您就可以快速启动并运行,而不必等待购买、安装和在线的新硬件或容量。本文将讨论如何在选择正确的云数据仓库指南中选择数据仓库。

    他们是怎样叠加的

    数据库

    用来从一个或几个源中存储数据。

    优势:处理数字交易,建立技术。

    不利因素:报表、可视化和分析不能在大量集成数据源和数据流中执行。

    数据仓库

    用来从许多不同的数据源汇总数据,并使用它们进行可视化、报告和分析。专用于分析。

    优势:更好地支持报告、分析、大型数据、数据检索和可视化,目的是存储来自任意数量数据源的数据。

    不利因素:与单一数据库相比成本较高,获取前准备/配置数据(对于云数据仓库),很少能控制访问和安全配置。