etl什么意思
關注:41 發布時間:2021-09-24 15:48:53
* *一、etl定義* *
etl是對業務系統的數據進行提取、清理和轉換,然后加載到數據倉庫中的過程。目的是整合企業中零散、雜亂、不統一的數據,為企業決策提供分析依據。
二、etl算法導圖
三、算法應用場景
這八種etl算法主要分為四類。增量累加和拉鏈算法更符合數據倉庫的歷史數據跟蹤。然而,在現實中,由于業務和性能的考慮,經常會有完全刪除、完全插入和增量累加算法的數據表應用。
四、算法詳解
1、全刪全插算法
dml語句中delete/insert實現的邏輯主要應用于維度表、參數表、主文件表的加載,即適合源表為全數據表,該數據表的業務邏輯目前只需要保存比較新的全數據,不需要跟蹤過去的歷史信息。
sql代碼模型:
步驟1。清空目標表
截斷表目標表名;
步驟2。完全插入
插入目標表名(字段1,* * *)
選擇字段* * *
來源表
***join關聯數據
where * * *
2、增量累全算法
使用upsert實現邏輯主要用于加載參數表和主文件表,即源表可以是增量表,也可以是全數據表,目標表始終有比較新比較完整的記錄。
sql代碼模型:
步驟1。創建處理源表的臨時表* * *;
插入臨時表(字段* * *)
選擇字段* * *
來源表
***join關聯數據
where * * *
—步驟2。merge into可以用來實現集成。目前還可以使用分步刪除/插入或更新/插入操作
作為t1合并到目標表中(字段* * *)
使用臨時表作為s1
on(pk)
當匹配時
更新集colx=s1。colx ***
當不匹配時
insert (field ***)值(field * * *);
3、增量累加
用append實現邏輯,主要用于加載流表,即在目標表中加入日流量和事件數據,保留整個歷史數據。流程表、快照表、統計分析表都是通過這個邏輯實現的。
sql代碼模型:
步驟1。插入目標表
插入目標表(字段1***)
選擇字段* * *
來源表
***join關聯數據
where * * *
4、全歷史拉鏈算法
拉鏈表定義:它是一個數據倉庫etl數據表,至少由pk字段、軌跡變更字段、開鏈日期和閉鏈日期組成。
拉鏈表的優點:可以根據開鏈日期和閉鏈日期快速提取對應日期的有效數據。對于跟蹤源系統的非事件流表數據,拉鏈算法起著更重要的作用,源業務系統的日變化數據通常是有限的。拉鏈處理可以在不丟失數據變化歷史的情況下,大大減少每日快照帶來的空間開銷。
全歷史拉鏈表算法的實現邏輯:提取當前有效記錄-提取當前源系統的比較新數據-根據pk字段將當前有效記錄與比較新源表進行比較,更新目標表的當前有效記錄,進行閉鏈操作-根據所有字段將比較新源表與當前有效記錄進行比較,插入目標表。
sql代碼模型:
步驟1。提取當前有效記錄
插入臨時表-開鏈-預(不包括開鏈字段* * *)
選擇不包括開/閉鏈字段* * *
從目標表
其中結束日期=日期“比較大日期”;
步驟2。提取日源系統的比較新數據
源表的臨時表
—步驟3的所有開放鏈數據,即包含新插入和數據更改的記錄。
插入臨時表-增量插件
選擇不包括開/閉鏈字段* * *
臨時表來自源表-當前
其中(不包括開閉鏈字段***)不在
(選擇不包括開閉鏈字段* * *
從臨時表-開鏈-預);
—4,我們需要閉環數據,即的變更記錄
插入臨時表-增量-更新
選擇不包括開閉鏈字段* * *,開始時間
臨時表從-開鏈-預
其中(不包括開閉鏈字段***)不在
(選擇不包括開閉鏈字段* * *
臨時表從開鏈到關
);
步驟5更新閉鏈數據,即歷史閉鏈(刪除-插入替換更新)
從目標表中刪除
在哪里(主鍵***)
(從臨時表中選擇主鍵***增量更新)
和結束日期=日期“比較大日期”;
插入目標表
(不包括開放/關閉鏈字段* * *、開始時間和結束日期)
選擇不包括開閉鏈字段* * *,開始時間,日期"數據日期"
臨時表從-遞增-遞增;
—6插入開鏈數據,即當天添加記錄
插入目標表
(不包括開放/關閉鏈字段* * *、開始時間和結束日期)
選擇不包括開/關鏈字段***,日期"數據日期",日期"比較大日期"
臨時表從增量導入;
5、增量拉鏈算法
算法實現的邏輯是提取前一天開鏈數據-pk相同的變更記錄,關閉舊的記錄鏈,打開新的記錄鏈-pk不同,源表存在,增加新的開鏈記錄。增量拉鏈的目的是跟蹤數據的增量變化歷史,根據pk對比拉一個新的開鏈數據。
sql代碼模型:
—步驟1。提取當前有效記錄
插入臨時表-開鏈-預(不包括開鏈字段* * *)
選擇不包括開/閉鏈字段* * *
從目標表
其中結束日期=日期“比較大日期”;
步驟2。提取當天源系統的增量記錄
源表的臨時表
—步驟3。選擇日源系統的新記錄
插入臨時表-增量插件
選擇不包括開/閉鏈字段* * *
臨時表從開鏈到關
哪里(pk)不在
(從臨時表-開鏈-預中選擇pk);
步驟4。提取日源系統的歷史變更記錄
插入臨時表-增量-更新
選擇不包括開/閉鏈字段* * *
臨時表從開鏈到關
內部連接臨時表-開鏈-預
on(pk 等值)
哪里(變化字段 非等值);
步驟5。更新歷史變更記錄,關閉舊的歷史鏈,打開新的歷史鏈
將目標表更新為t1
設置變化字段 s1賦值,結束日期=日期"數據日期"
臨時表從-增量-更新為s1
哪里(pk 等值)
和t1。結束日期=日期"比較大日期"
插入目標表
(不包括開放/關閉鏈字段* * *、開始時間和結束日期)
選擇不包括開/關鏈字段***,日期"數據日期",日期"比較大日期"
臨時表from-increment-upd;
第6步。插入所有新鏈接數據
插入目標表
(不包括開放/關閉鏈字段* * *、開始時間和結束日期)
選擇不包括開/關鏈字段***,日期"數據日期",日期"比較大日期"
臨時表from-increment-ins;
6、增刪拉鏈算法
算法的邏輯是:提取前一天的開鏈數據-提取源表的未刪除記錄-pk同變記錄,關閉舊記錄鏈,打開新記錄鏈-pk對比,源表存在,添加開鏈記錄-提取源表的刪除記錄-pk對比,舊開鏈記錄存在,關閉舊記錄鏈。
sql代碼模型:
—步驟1。清理目標表
截斷表目標表;
-第二步。完全插入
插入目標表(字段* * *)
選擇字段* * *
來源表
***join關聯數據
where * * *
7、全量增刪拉鏈算法
算法實現邏輯是提取比較后一天的開鏈數據-提取源表pk中未刪除的記錄相同的變更記錄,關閉舊記錄鏈,打開新記錄鏈-pk比較,源表存在,添加開鏈記錄-提取源表中刪除的記錄-pk比較,舊開鏈記錄存在,關閉舊記錄鏈-pk比較,提取舊開鏈中存在但不在源表中的記錄,關閉舊記錄鏈。主要使用業務字段來跟蹤包含在總數據中的刪除的變更歷史。
sql代碼模型:
—步驟1。清理目標表
截斷表目標表;
-第二步。完全插入
插入目標表(字段* * *)
選擇字段* * *
來源表
***join關聯數據
where * * *
8、自拉鏈算法
根據源表的業務日期字段,與目標表的起止日期進行對比,首尾相連,拉出全歷史拉鏈,主要是將流水表數據轉換成拉鏈表數據。
sql代碼模型:
步驟1。清理目標表
截斷表目標表;
步驟2。完全插入
插入目標表(字段* * *)
選擇字段* * *
來源表
***join關聯數據
where * * *
在實際工作中,所有數據表通常都包含一些控制字段,即插入日期、更新日期和更新源字段,以便對數據變化敏感的數據倉庫可以進一步跟蹤數據變化歷史。
問泰特萊tetley是什么檔次
teitler是一個受歡迎的茶和咖啡品牌。
英國的泰特萊茶始于1837年,在41個國家和地區銷售。贏得了各種口味的高端消費者的青睞。它屬于印度著名的塔塔集團,是著名的茶葉公司之一。
泰德勒的主要產品是袋泡茶。
塔塔飲料公司(原塔塔茶葉集團)是第二大茶葉品牌供應商,業務往來遍及60多個國家。該集團的主要公司包括塔塔茶葉、總部位于美國的泰特利集團和塔塔咖啡。
問detllou是什么牌子?h油膏
detllou是中號品牌的h膏。
迪諾主要經營香薰洗發水系列。detllou dino起源于保加利亞中部的玫瑰王國卡爾活躍(carl active),是一個氣候溫暖濕潤、風景秀麗的小鎮。天地靈氣孕育傳奇玫瑰精油!迪諾試圖用這個傳說演繹另一個傳說,50年的專業護理。
問大都會人壽metlife是什么檔次
大都會人壽是一個受歡迎的金融和保險品牌。
中美聯泰都市人壽保險有限公司(以下簡稱“都市人壽”)是美國都市集團的子公司與上海聯合投資有限公司的合資企業.憑借美國大都會集團在保險行業的豐富經驗和上海聯合投資有限公司對中國市場的深入了解,大都會人壽致力于為中國消費者提供可靠、專業的保險解決方案。通過咨詢營銷、銀行保險、直銷和團體保險,大都會人壽為全國20多個城市的消費者提供人壽保險、健康保險、意外保險和儲蓄保險產品等保險服務。
大都會人壽的主要產品是兒童保險。意外險;健康保險;旅游保險。
憑借豐富的保險行業經驗、資源和愿景,大都會集團已成為的人壽保險公司和員工福利提供商,提供的產品和服務來滿足客戶需求。在過去的幾年里,大都會人壽為信任我們的客戶提供了堅實的保證。我們在中國的成功是基于多年的專業經驗、卓越的領導力、穩定的投資以及創新的產品和服務。未來,我們將繼續努力幫助客戶更好地了解自己的財務狀況,為客戶定制個性化的財務規劃。
問迪諾detllou是什么檔次
dino是比較受歡迎的美發產品品牌。
廣州奧盈化妝品有限公司是迪諾玫瑰香薰洗發美發產品的生產廠家,是一家集科研為中心,集生產、銷售、服務為一體的一站式專業洗發美發產品科技型生產企業。2003年,廣州奧盈化妝品有限公司正式成立,致力于生產高品質的洗發水和護發產品、發飾和沐浴露。迪諾玫瑰香薰洗發水、迪諾玫瑰香薰護發素、香薰沐浴露等產品廣泛應用于家用、發廊、禮品等領域。
迪諾的主要產品是h軟膏;香水洗發水;洗發水;沐浴露;發膜;彈性;護發素。
九年來,公司在從小規模生產到現代化工廠的發展過程中,始終堅持技術質量是企業生命力的經營宗旨,建立了一套完整的產品檢驗機制,確保產品質量。整個生產過程采用iso9001-2000質量體系標準,并對生產進行監控,確保產品批次質量穩定。憑借卓越的質量控制和完善的售后服務,我們為行業內大大小小的經銷商大量提供高品質的洗發水、護發和沐浴產品。產品暢銷國內,出口東南亞、韓國、歐美。自成立以來,奧瑩已與美國、法國和日本的許多化妝品科學研究中心合作.
問迪諾detllou是哪個國家的品牌
dino detllou是中國品牌。廣州奧盈化妝品有限公司,detllou dino dino rose香薰系列洗發水和美發產品的生產廠家,(廣州奧盈?化妝品?是一家以科研為中心,集生產、銷售、服務為一體的一站式專業洗發美發產品科技型生產企業。2003年,廣州奧盈化妝品有限公司正式成立,專注于生產高品質洗發水和護發產品、發飾和沐浴露。迪諾玫瑰香薰洗發水、迪諾玫瑰香薰護發素、香薰沐浴露等產品廣泛應用于家用、發廊、禮品等領域。
九年來,公司在從小規模生產到現代化工廠的發展過程中,始終堅持技術質量是企業生命力的經營宗旨,建立了一套完整的產品檢驗機制。整個生產過程采用iso9001-2000質量體系標準進行生產監控。憑借卓越的質量控制和完善的售后服務,我們為行業內大大小小的經銷商大量提供高品質的洗發水、護發和沐浴產品。產品暢銷國內,出口東南亞、韓國、歐美。奧瑩成立之初,就與美國、法國、日本等多個化妝品科研中心,以及注冊化學博士工程師建立了技術信息互動合作,充分整合國內外資源優勢,結合國內外市場需求開發相關產品,使企業的科研水平和技術應用始終處于國內同行業前列。目前,奧盈是中國洗發水和護發產品的專業制造商之一,產品種類齊全。
上一篇:蘋果x屏幕出現一條綠線
猜你喜歡
-
什么購物軟件可以微信支付25人支持
說實話,微信涉及的市場越來越多,能使用微信支付的軟件也不容易列出來,我就總結幾類能使用微信支付的軟件吧!一、所有的騰訊軟件(騰訊各種游戲,當當等等)微信隸屬于騰訊,可以說是馬化…
-
網友借錢不還怎么辦51人支持
網友1:還債很自然!但是現在是大叔欠錢不還。生活很瀟灑,讓人真的很生氣。不管你說什么,你就是不還錢,好像應該有人欠他們一樣。他們真的沒有辦法還錢嗎?本文介紹如何處理欠錢不還…
-
微信怎么隱藏好友74人支持
微信怎么隱藏好友?很多朋友想建立秘密朋友,不想被別人看到。那么我們如何隱藏我們的朋友呢?讓我們看看!微信如何隱藏好友方法一:手動隱藏1.打開手機桌面上的微信app2.然后找朋友…
-
美團月付怎么開通?72人支持
想必大家對支付寶的花店已經很熟悉了。這個月買,下個月付的功能給大家提供了很多方便,這個期間不會產生利息。最近美團正式推出信用支付產品——美團月供,被稱為美團的“花園”…
-
五星好評回復大全46人支持
毫無疑問,評論對店鋪的影響很大。你要回復差評和好評,要有技巧的回復。如何回應好評,才能把有好感的客戶變成忠實粉絲?如何回復差評可以防止潛在客戶受到差評的影響?好評的回復技…
-
布達拉宮地下未解之謎65人支持
布達拉宮是一個充滿神秘的請教圣地,自古以來就流傳著許多神秘的事情。一方面與建筑綜合體本身的復雜結構有關,另一方面也與佛教圣地的神圣性有關。據說布達拉宮的“三大未解之…
-
信用卡自動秒回平臺有哪些?4人支持
說到信用卡,很多人都是又悲又喜。生活資金緊張的時候,大家紛紛想到信用卡。因為向親戚朋友借錢怕被拒絕,哪怕借你一點錢,說實話也借不了你很多次,于是很多人開始用信用卡。以前剛…
-
玩抖音能掙錢嗎57人支持
外面的消息喜憂參半。有人告訴你,他每月給tik tok的傭金是幾百萬。有些人告訴你現在不要成為tik tok。普通人幾乎賺不到錢。哪個是真的?沒關系。我今天教你的方法就是賺點小…
-
拼多多刷銷量罰款多嗎84人支持
在電商平臺,商家是禁止刷卡的,但還是會有很多商家刷卡。比如在拼多多平臺,刷卡消費是很常見的。如果拼多多刷卡違規,應該如何處罰?我們可能都知道刷卡有一定的風險,被抓了會受到懲…
-
2019什么游戲代練好賺錢74人支持
當然,在玩游戲而不是訓練的時候,還是要找到現在流行的游戲。否則冷門的游戲如果被某些人玩了,名單就不多了。今天,小編將告訴你2019年什么游戲對訓練和賺錢有好處。當然,這是當前…
-
第二次提取公積金間隔60人支持
公積金最高貸款額度提升至雙職工80萬元 單職工50萬元五城區房租提取額度上調至1000元/月客戶在申請公積金貸款時需要注意哪些方面的問題?近日,福建省住房公積金管理中心和福州…
-
8868交易平臺安全嗎35人支持
你在手游交易中看重什么?價格、方便、速度還是安全?困擾手機游戲玩家很久的四大問題終于找到了妥善的解決辦法。為手機游戲提供相關交易服務的電商平臺8868,最近受到了手機游戲…
熱門十大品牌
- 2021年我國十大黃金品牌排行榜31000人
- 眼鏡品牌十大排行榜前10名26361人
- 十大證券公司排行榜前10名23243人
- 2021年我國雜志排行榜前10名20054人
- 我國十大雜志排行榜前10名16359人
- 2021我國十個宜居城市排行榜前11487人
- 男士褲子品牌十大排行榜前10名11186人
- 2021十大火熱電腦游戲排行榜前11057人
- 十大衛生巾品牌排行榜前十名8848人
- 我國十大襪子品牌排行榜前十名8371人