Google Data Catalog如何幫忙管理數據?
產品介紹與體驗心得
隨著Data得重要性被意識到,越來越多公司開始引入大數據技術,也不斷加強Data的應用,隨著Big Data越來越普及、越來越複雜的數據以及架構,對數據生產者跟數據消費者也面臨越來越棘手的問題。
對於數據生產者,用戶隱私意識的加強,伴隨資料保護法的推出(例如歐盟的通用資料保護法-GDPR),哪裡存在了隱私數據、這些隱私數據該如何管控?
對於數據消費者(涵蓋了數據分析師、產品、營運等多種角色),我們常常不理解跟不信任數據,問題圍繞以下幾點:
- How to find it?該去哪裡找到我想要的數據?
- Can it be used?數據能用嗎?是不是最新的數據?有沒有髒數據?( 延伸閱讀<數據太髒了!3個步驟做好數據質量管理> )
- Should it be used?對於我要分析的業務、主題,這數據是我要用的?
- How should it be used? 每個column什麼意思?表跟表之間什麼關係?
做數據分析的朋友可以想一下,是不是在分析前這些過程就佔了許多時間?可能你們團隊內部還有維護word或excel做紀錄。
這些都可以被列為數據治理(Data Governance)的議題,以前如果要系統的管理這塊,必須內部自己開發Data Governance產品,或是藉由開源產品(例如Apache Atlas、LinkedIn Wherehows)做二次開發。
隨著雲服務發展、相關廠商包含微軟Azure、Google Cloud、IBM、AWS等都有數據治理的產品,也有專門做數據治理產品的公司,例如DataHub、Alation
這篇文章介紹Google Cloud- Data Catalog這款產品的功能、能力(多圖),並總結下我的體驗心得。
邀請你至Blog閱讀全文:Google Data Catalog如何幫忙管理數據?產品介紹與心得體驗
也邀請你訂閱『Rock Data』電子報,支持我持續創作
也曾想改變世界,於是背了把吉他隻身踏上大陸互聯網,熱愛鑽研數據、產品與業務之間的本質。 經營「 ROCK DATA | 玩搖滾的數據人 」社群。
1. Hello,如果你喜歡我的文章,請至『Rock Data』Blog閱讀新文章完整內容。也邀請你訂閱『Rock Data』電子報,支持我持續創作(Medium站仍將張貼新文章訊息)2.立即追蹤👉『Rock Data』臉書粉絲頁跟IG(@andyrockdata),獲取最新消息3.【入門數據分析,掌握HiveSQL取數能力】在hahow上架啦,購買連結👉 http://hahow.in/cr/andyrockhive4. 半佛系鼓掌:原來只要滑鼠一直按著不放就可以一直鼓掌了。那請你按久一點:)有任何想法或感興趣的地方歡迎留言/討論,或者私訊我!5. 往期的數據相關文章可以參考以下link
- 數據分析系列1:談談數據分析的眾多Title
- 數據分析系列2:數據分析的一週工作日程
- 數據分析系列3:身為資料分析師,你該如何展現工作中的價值?
- 數據分析系列4:如何量化職場規劃?我這次的轉職規劃與Offer選擇
- 數據分析系列5:為什麼要關心資料來源?談談埋點數據的陷阱
- 數據分析系列6:精選幾個機器學習的學習資源
- 數據分析系列7:數位化決策轉型與企業文化的一些思考
- 數據分析系列8:中山大學經濟所職涯座談(ㄧ):”了解自己”的重要&我怎麼成為數據分析師
- 數據分析系列9:中山大學經濟所職涯座談(二):想從事資料分析?你需要具備這8個能力
- 數據分析系列10:中山大學經濟所職涯座談(三) :讓資料變商機 — 資料分析在我們生活中的應用
- 數據分析系列11:面試時,資料分析師該怎麼準備作品集?
- 數據分析系列12:2018年終工作總結(數據分析師)
- 數據分析系列13:數據化運營中玩過的分析項目:一個數據分析師的經驗總結
- 數據分析系列14:如何提升運營/產品的優化效率?或許數據指標體系的搭建可以幫到忙
- 數據分析系列15:用戶畫像很重要,那你知道是怎麼畫出來的嗎?
- 數據分析系列16:給剛入行的數據分析師:想產生價值,在試用期要做的三件事
- 數據分析系列17:2019 數據分析工作總結_關鍵詞:數倉構建、BI可視化看板、用戶畫像(標籤)與精準行銷
- 數據分析系列18:入門數據分析的第一個大門檻:SQL/Hive取數-聊聊自身學習SQL的經歷以及三個自學網站分享
- 數據分析系列19:身為數據分析師,我怎麼看hahow上”R語言和商業分析”這門課
- 數據分析系列20:直接用SQL來分析數據?怎麼沒用python/R?3個面向來考量分析工具的選擇
- 數據分析系列21:數據分析的”橫向”學習之路-珍藏的網上文章重新整理放上github
- 數據分析系列22:透過埋點,讓數據說話:埋點基本知識
- 數據分析系列23:以數據為核心的CRM進化產品:帶你了解CDP(客戶數據平台)開發過程與難點
- 數據分析系列24:SQL不難啊,為什麼不容易精通?自學與實務的4個落差
- 數據分析系列25:數據分析基本-相關分析與可視化(R語言)
- 數據分析系列26:刷完了Leetcode SQL Hard Level的28道題:歡迎領取參考答案
- 數據分析系列27:數據太髒了!3個步驟做好數據質量管理
- 數據分析系列28:跨部門溝通成本太高?數據人實現高效跨部門溝通的4個方式
- 數據分析系列29:數據分析師職場發展的另類出路
- 數據分析系列30:Databrick為何收購BI產品Redash?產品視角來看Redash的功能與價值
- 數據分析系列31:數據分析師要失業了?解讀<2022 Gartner BI魔力象限> BI產品趨勢
- 數據分析系列32:Google Data Catalog如何幫忙管理數據? 產品介紹與體驗心得
- 數據分析系列33:復盤:數據產品從0到1的建設過程,我的9點感觸
- 數據分析系列34:Shopline-數據分析中心(Shoplytics)產品體驗
- 數據分析系列35:搞數據還是做產品?淺談『數據產品經理』