Google Data Catalog如何幫忙管理數據?

產品介紹與體驗心得

隨著Data得重要性被意識到,越來越多公司開始引入大數據技術,也不斷加強Data的應用,隨著Big Data越來越普及、越來越複雜的數據以及架構,對數據生產者跟數據消費者也面臨越來越棘手的問題。

對於數據生產者,用戶隱私意識的加強,伴隨資料保護法的推出(例如歐盟的通用資料保護法-GDPR),哪裡存在了隱私數據、這些隱私數據該如何管控?

對於數據消費者(涵蓋了數據分析師、產品、營運等多種角色),我們常常不理解跟不信任數據,問題圍繞以下幾點:

  • How to find it?該去哪裡找到我想要的數據?
  • Can it be used?數據能用嗎?是不是最新的數據?有沒有髒數據?( 延伸閱讀<數據太髒了!3個步驟做好數據質量管理> )
  • Should it be used?對於我要分析的業務、主題,這數據是我要用的?
  • How should it be used? 每個column什麼意思?表跟表之間什麼關係?

做數據分析的朋友可以想一下,是不是在分析前這些過程就佔了許多時間?可能你們團隊內部還有維護word或excel做紀錄。

這些都可以被列為數據治理(Data Governance)的議題,以前如果要系統的管理這塊,必須內部自己開發Data Governance產品,或是藉由開源產品(例如Apache Atlas、LinkedIn Wherehows)做二次開發。

隨著雲服務發展、相關廠商包含微軟Azure、Google Cloud、IBM、AWS等都有數據治理的產品,也有專門做數據治理產品的公司,例如DataHub、Alation

這篇文章介紹Google Cloud- Data Catalog這款產品的功能、能力(多圖),並總結下我的體驗心得。

邀請你至Blog閱讀全文:Google Data Catalog如何幫忙管理數據?產品介紹與心得體驗

也邀請你訂閱『Rock Data』電子報,支持我持續創作

也曾想改變世界,於是背了把吉他隻身踏上大陸互聯網,熱愛鑽研數據、產品與業務之間的本質。 經營「 ROCK DATA | 玩搖滾的數據人 」社群。

1. Hello,如果你喜歡我的文章,請至『Rock Data』Blog閱讀新文章完整內容。也邀請你訂閱『Rock Data』電子報,支持我持續創作(Medium站仍將張貼新文章訊息)2.立即追蹤👉『Rock Data』臉書粉絲頁跟IG(@andyrockdata),獲取最新消息3.【入門數據分析,掌握HiveSQL取數能力】在hahow上架啦,購買連結👉 http://hahow.in/cr/andyrockhive4. 半佛系鼓掌:原來只要滑鼠一直按著不放就可以一直鼓掌了。那請你按久一點:)有任何想法或感興趣的地方歡迎留言/討論,或者私訊我!5. 往期的數據相關文章可以參考以下link

--

--

邱國欣(Andy Chiu)
邱國欣(Andy Chiu)

Written by 邱國欣(Andy Chiu)

文章內容以數據為主軸,分享工作跟生活的心得與總結,希望我的經歷,可以或多或少幫助到大家。如果你熱愛你所做的事,那麼你肯定會暫時遺忘了時間!「 ROCK DATA | 玩搖滾的數據人 」Blog:https://www.andyrockdata.com

No responses yet