当前位置:首页 > 行业知识 > 综合

etl什么意思

关注:41 发布时间:2021-09-24 15:48:53

* *一、etl定义* *

etl是对业务系统的数据进行提取、清理和转换,然后加载到数据仓库中的过程。目的是整合企业中零散、杂乱、不统一的数据,为企业决策提供分析依据。

二、etl算法导图

三、算法应用场景

这八种etl算法主要分为四类。增量累加和拉链算法更符合数据仓库的历史数据跟踪。然而,在现实中,由于业务和性能的考虑,经常会有完全删除、完全插入和增量累加算法的数据表应用。

四、算法详解

1、全删全插算法

dml语句中delete/insert实现的逻辑主要应用于维度表、参数表、主文件表的加载,即适合源表为全数据表,该数据表的业务逻辑目前只需要保存比较新的全数据,不需要跟踪过去的历史信息。

sql代码模型:

步骤1。清空目标表

截断表目标表名;

步骤2。完全插入

插入目标表名(字段1,* * *)

选择字段* * *

来源表

***join关联数据

where * * *

2、增量累全算法

使用upsert实现逻辑主要用于加载参数表和主文件表,即源表可以是增量表,也可以是全数据表,目标表始终有比较新比较完整的记录。

sql代码模型:

步骤1。创建处理源表的临时表* * *;

插入临时表(字段* * *)

选择字段* * *

来源表

***join关联数据

where * * *

—步骤2。merge into可以用来实现集成。目前还可以使用分步删除/插入或更新/插入操作

作为t1合并到目标表中(字段* * *)

使用临时表作为s1

on(pk)

当匹配时

更新集colx=s1。colx ***

当不匹配时

insert (field ***)值(field * * *);

3、增量累加

用append实现逻辑,主要用于加载流表,即在目标表中加入日流量和事件数据,保留整个历史数据。流程表、快照表、统计分析表都是通过这个逻辑实现的。

sql代码模型:

步骤1。插入目标表

插入目标表(字段1***)

选择字段* * *

来源表

***join关联数据

where * * *

4、全历史拉链算法

拉链表定义:它是一个数据仓库etl数据表,至少由pk字段、轨迹变更字段、开链日期和闭链日期组成。

拉链表的优点:可以根据开链日期和闭链日期快速提取对应日期的有效数据。对于跟踪源系统的非事件流表数据,拉链算法起着更重要的作用,源业务系统的日变化数据通常是有限的。拉链处理可以在不丢失数据变化历史的情况下,大大减少每日快照带来的空间开销。

全历史拉链表算法的实现逻辑:提取当前有效记录-提取当前源系统的比较新数据-根据pk字段将当前有效记录与比较新源表进行比较,更新目标表的当前有效记录,进行闭链操作-根据所有字段将比较新源表与当前有效记录进行比较,插入目标表。

sql代码模型:

步骤1。提取当前有效记录

插入临时表-开链-预(不包括开链字段* * *)

选择不包括开/闭链字段* * *

从目标表

其中结束日期=日期“比较大日期”;

步骤2。提取日源系统的比较新数据

源表的临时表

—步骤3的所有开放链数据,即包含新插入和数据更改的记录。

插入临时表-增量插件

选择不包括开/闭链字段* * *

临时表来自源表-当前

其中(不包括开闭链字段***)不在

(选择不包括开闭链字段* * *

从临时表-开链-预);

—4,我们需要闭环数据,即的变更记录

插入临时表-增量-更新

选择不包括开闭链字段* * *,开始时间

临时表从-开链-预

其中(不包括开闭链字段***)不在

(选择不包括开闭链字段* * *

临时表从开链到关

);

步骤5更新闭链数据,即历史闭链(删除-插入替换更新)

从目标表中删除

在哪里(主键***)

(从临时表中选择主键***增量更新)

和结束日期=日期“比较大日期”;

插入目标表

(不包括开放/关闭链字段* * *、开始时间和结束日期)

选择不包括开闭链字段* * *,开始时间,日期"数据日期"

临时表从-递增-递增;

—6插入开链数据,即当天添加记录

插入目标表

(不包括开放/关闭链字段* * *、开始时间和结束日期)

选择不包括开/关链字段***,日期"数据日期",日期"比较大日期"

临时表从增量导入;

5、增量拉链算法

算法实现的逻辑是提取前一天开链数据-pk相同的变更记录,关闭旧的记录链,打开新的记录链-pk不同,源表存在,增加新的开链记录。增量拉链的目的是跟踪数据的增量变化历史,根据pk对比拉一个新的开链数据。

sql代码模型:

—步骤1。提取当前有效记录

插入临时表-开链-预(不包括开链字段* * *)

选择不包括开/闭链字段* * *

从目标表

其中结束日期=日期“比较大日期”;

步骤2。提取当天源系统的增量记录

源表的临时表

—步骤3。选择日源系统的新记录

插入临时表-增量插件

选择不包括开/闭链字段* * *

临时表从开链到关

哪里(pk)不在

(从临时表-开链-预中选择pk);

步骤4。提取日源系统的历史变更记录

插入临时表-增量-更新

选择不包括开/闭链字段* * *

临时表从开链到关

内部连接临时表-开链-预

on(pk 等值)

哪里(变化字段 非等值);

步骤5。更新历史变更记录,关闭旧的历史链,打开新的历史链

将目标表更新为t1

设置变化字段 s1赋值,结束日期=日期"数据日期"

临时表从-增量-更新为s1

哪里(pk 等值)

和t1。结束日期=日期"比较大日期"

插入目标表

(不包括开放/关闭链字段* * *、开始时间和结束日期)

选择不包括开/关链字段***,日期"数据日期",日期"比较大日期"

临时表from-increment-upd;

第6步。插入所有新链接数据

插入目标表

(不包括开放/关闭链字段* * *、开始时间和结束日期)

选择不包括开/关链字段***,日期"数据日期",日期"比较大日期"

临时表from-increment-ins;

6、增删拉链算法

算法的逻辑是:提取前一天的开链数据-提取源表的未删除记录-pk同变记录,关闭旧记录链,打开新记录链-pk对比,源表存在,添加开链记录-提取源表的删除记录-pk对比,旧开链记录存在,关闭旧记录链。

sql代码模型:

—步骤1。清理目标表

截断表目标表;

-第二步。完全插入

插入目标表(字段* * *)

选择字段* * *

来源表

***join关联数据

where * * *

7、全量增删拉链算法

算法实现逻辑是提取比较后一天的开链数据-提取源表pk中未删除的记录相同的变更记录,关闭旧记录链,打开新记录链-pk比较,源表存在,添加开链记录-提取源表中删除的记录-pk比较,旧开链记录存在,关闭旧记录链-pk比较,提取旧开链中存在但不在源表中的记录,关闭旧记录链。主要使用业务字段来跟踪包含在总数据中的删除的变更历史。

sql代码模型:

—步骤1。清理目标表

截断表目标表;

-第二步。完全插入

插入目标表(字段* * *)

选择字段* * *

来源表

***join关联数据

where * * *

8、自拉链算法

根据源表的业务日期字段,与目标表的起止日期进行对比,首尾相连,拉出全历史拉链,主要是将流水表数据转换成拉链表数据。

sql代码模型:

步骤1。清理目标表

截断表目标表;

步骤2。完全插入

插入目标表(字段* * *)

选择字段* * *

来源表

***join关联数据

where * * *

在实际工作中,所有数据表通常都包含一些控制字段,即插入日期、更新日期和更新源字段,以便对数据变化敏感的数据仓库可以进一步跟踪数据变化历史。

泰特莱tetley是什么档次

teitler是一个受欢迎的茶和咖啡品牌。

英国的泰特莱茶始于1837年,在41个国家和地区销售。赢得了各种口味的高端消费者的青睐。它属于印度著名的塔塔集团,是著名的茶叶公司之一。

泰德勒的主要产品是袋泡茶。

塔塔饮料公司(原塔塔茶叶集团)是第二大茶叶品牌供应商,业务往来遍及60多个国家。该集团的主要公司包括塔塔茶叶、总部位于美国的泰特利集团和塔塔咖啡。

detllou是什么牌子?h油膏

detllou是中号品牌的h膏。

迪诺主要经营香薰洗发水系列。detllou dino起源于保加利亚中部的玫瑰王国卡尔活跃(carl active),是一个气候温暖湿润、风景秀丽的小镇。天地灵气孕育传奇玫瑰精油!迪诺试图用这个传说演绎另一个传说,50年的专业护理。

大都会人寿metlife是什么档次

大都会人寿是一个受欢迎的金融和保险品牌。

中美联泰都市人寿保险有限公司(以下简称“都市人寿”)是美国都市集团的子公司与上海联合投资有限公司的合资企业.凭借美国大都会集团在保险行业的丰富经验和上海联合投资有限公司对中国市场的深入了解,大都会人寿致力于为中国消费者提供可靠、专业的保险解决方案。通过咨询营销、银行保险、直销和团体保险,大都会人寿为全国20多个城市的消费者提供人寿保险、健康保险、意外保险和储蓄保险产品等保险服务。

大都会人寿的主要产品是儿童保险。意外险;健康保险;旅游保险。

凭借丰富的保险行业经验、资源和愿景,大都会集团已成为的人寿保险公司和员工福利提供商,提供的产品和服务来满足客户需求。在过去的几年里,大都会人寿为信任我们的客户提供了坚实的保证。我们在中国的成功是基于多年的专业经验、卓越的领导力、稳定的投资以及创新的产品和服务。未来,我们将继续努力帮助客户更好地了解自己的财务状况,为客户定制个性化的财务规划。

迪诺detllou是什么档次

dino是比较受欢迎的美发产品品牌。

广州奥盈化妆品有限公司是迪诺玫瑰香薰洗发美发产品的生产厂家,是一家集科研为中心,集生产、销售、服务为一体的一站式专业洗发美发产品科技型生产企业。2003年,广州奥盈化妆品有限公司正式成立,致力于生产高品质的洗发水和护发产品、发饰和沐浴露。迪诺玫瑰香薰洗发水、迪诺玫瑰香薰护发素、香薰沐浴露等产品广泛应用于家用、发廊、礼品等领域。

迪诺的主要产品是h软膏;香水洗发水;洗发水;沐浴露;发膜;弹性;护发素。

九年来,公司在从小规模生产到现代化工厂的发展过程中,始终坚持技术质量是企业生命力的经营宗旨,建立了一套完整的产品检验机制,确保产品质量。整个生产过程采用iso9001-2000质量体系标准,并对生产进行监控,确保产品批次质量稳定。凭借卓越的质量控制和完善的售后服务,我们为行业内大大小小的经销商大量提供高品质的洗发水、护发和沐浴产品。产品畅销国内,出口东南亚、韩国、欧美。自成立以来,奥莹已与美国、法国和日本的许多化妆品科学研究中心合作.

迪诺detllou是哪个国家的品牌

dino detllou是中国品牌。广州奥盈化妆品有限公司,detllou dino dino rose香薰系列洗发水和美发产品的生产厂家,(广州奥盈?化妆品?是一家以科研为中心,集生产、销售、服务为一体的一站式专业洗发美发产品科技型生产企业。2003年,广州奥盈化妆品有限公司正式成立,专注于生产高品质洗发水和护发产品、发饰和沐浴露。迪诺玫瑰香薰洗发水、迪诺玫瑰香薰护发素、香薰沐浴露等产品广泛应用于家用、发廊、礼品等领域。

九年来,公司在从小规模生产到现代化工厂的发展过程中,始终坚持技术质量是企业生命力的经营宗旨,建立了一套完整的产品检验机制。整个生产过程采用iso9001-2000质量体系标准进行生产监控。凭借卓越的质量控制和完善的售后服务,我们为行业内大大小小的经销商大量提供高品质的洗发水、护发和沐浴产品。产品畅销国内,出口东南亚、韩国、欧美。奥莹成立之初,就与美国、法国、日本等多个化妆品科研中心,以及注册化学博士工程师建立了技术信息互动合作,充分整合国内外资源优势,结合国内外市场需求开发相关产品,使企业的科研水平和技术应用始终处于国内同行业前列。目前,奥盈是中国洗发水和护发产品的专业制造商之一,产品种类齐全。

猜你喜欢

  • 什么购物软件可以微信支付

    什么购物软件可以微信支付25人支持

    说实话,微信涉及的市场越来越多,能使用微信支付的软件也不容易列出来,我就总结几类能使用微信支付的软件吧!一、所有的腾讯软件(腾讯各种游戏,当当等等)微信隶属于腾讯,可以说是马化…

  • 网友借钱不还怎么办

    网友借钱不还怎么办51人支持

    网友1:还债很自然!但是现在是大叔欠钱不还。生活很潇洒,让人真的很生气。不管你说什么,你就是不还钱,好像应该有人欠他们一样。他们真的没有办法还钱吗?本文介绍如何处理欠钱不还…

  • 微信怎么隐藏好友

    微信怎么隐藏好友74人支持

    微信怎么隐藏好友?很多朋友想建立秘密朋友,不想被别人看到。那么我们如何隐藏我们的朋友呢?让我们看看!微信如何隐藏好友方法一:手动隐藏1.打开手机桌面上的微信app2.然后找朋友…

  • 美团月付怎么开通?

    美团月付怎么开通?72人支持

    想必大家对支付宝的花店已经很熟悉了。这个月买,下个月付的功能给大家提供了很多方便,这个期间不会产生利息。最近美团正式推出信用支付产品——美团月供,被称为美团的“花园”…

  • 五星好评回复大全

    五星好评回复大全46人支持

    毫无疑问,评论对店铺的影响很大。你要回复差评和好评,要有技巧的回复。如何回应好评,才能把有好感的客户变成忠实粉丝?如何回复差评可以防止潜在客户受到差评的影响?好评的回复技…

  • 布达拉宫地下未解之谜

    布达拉宫地下未解之谜65人支持

    布达拉宫是一个充满神秘的请教圣地,自古以来就流传着许多神秘的事情。一方面与建筑综合体本身的复杂结构有关,另一方面也与佛教圣地的神圣性有关。据说布达拉宫的“三大未解之…

  • 信用卡自动秒回平台有哪些?

    信用卡自动秒回平台有哪些?4人支持

    说到信用卡,很多人都是又悲又喜。生活资金紧张的时候,大家纷纷想到信用卡。因为向亲戚朋友借钱怕被拒绝,哪怕借你一点钱,说实话也借不了你很多次,于是很多人开始用信用卡。以前刚…

  • 玩抖音能挣钱吗

    玩抖音能挣钱吗57人支持

    外面的消息喜忧参半。有人告诉你,他每月给tik tok的佣金是几百万。有些人告诉你现在不要成为tik tok。普通人几乎赚不到钱。哪个是真的?没关系。我今天教你的方法就是赚点小…

  • 拼多多刷销量罚款多吗

    拼多多刷销量罚款多吗84人支持

    在电商平台,商家是禁止刷卡的,但还是会有很多商家刷卡。比如在拼多多平台,刷卡消费是很常见的。如果拼多多刷卡违规,应该如何处罚?我们可能都知道刷卡有一定的风险,被抓了会受到惩…

  • 2019什么游戏代练好赚钱

    2019什么游戏代练好赚钱74人支持

    当然,在玩游戏而不是训练的时候,还是要找到现在流行的游戏。否则冷门的游戏如果被某些人玩了,名单就不多了。今天,小编将告诉你2019年什么游戏对训练和赚钱有好处。当然,这是当前…

  • 第二次提取公积金间隔

    第二次提取公积金间隔60人支持

    公积金最高贷款额度提升至双职工80万元 单职工50万元五城区房租提取额度上调至1000元/月客户在申请公积金贷款时需要注意哪些方面的问题?近日,福建省住房公积金管理中心和福州…

  • 8868交易平台安全吗

    8868交易平台安全吗35人支持

    你在手游交易中看重什么?价格、方便、速度还是安全?困扰手机游戏玩家很久的四大问题终于找到了妥善的解决办法。为手机游戏提供相关交易服务的电商平台8868,最近受到了手机游戏…