[Graph Database] 數據分析的輕量工具 - SQL Server 2017 with Graph Database

黃雨謙 2018/12/28 19:41:24
2513

[Graph Database] 數據分析的輕量工具 - SQL Server 2017 with Graph Database


簡介

介紹微軟新加入的圖形化資料庫功能,讓有經驗的同仁不需要再另外建置額外環境,快速做分析。

作者

黃雨謙


 

      Industry 4.0帶動製造工廠轉型智能工廠。由一堆感控裝置組件系統使用物聯網產生巨量資料結合AI技術、數據分析,讓早期一板一眼生硬製造流程轉型為具有感覺的軟式、適應性、效率性作業模式。而技術基礎其中之一就是大數據(巨量資料Big Data)。巨量資料透與電腦為媒介進行探勘、解析、比對、分析、統計發掘客觀性、顯著性具有影響性的關鍵資料。模仿日常生活中大家儲存文件資料時可使用資料櫃來保存文件、分類等等,數位資料作為儲存資料稱為資料庫。而今資料庫又分關聯型資料庫(SQL)與非關聯型資料庫(NoSQL),關聯型資料庫,例如:OracleMicrosoft SQL ServerMySQLPostgreSQL。非關聯式資料庫(NoSQL)有文件儲存、圖形資料庫、鍵-值、主機式服務、多資料庫、時序型資料、物件資料庫、列儲存。今天就以圖形資料庫來探討大數據應用。

 

關係是資料的主要價值就適合用圖形資料庫。圖形資料庫使用Node來存放資料實體利用Edge來存放實體間的關係。一個節點擁有的Edge是沒有限制。在應用上,圖形資料庫能使用關係(Transaction)以幾乎即時找到雙方節點。舉例來說,在圖形查詢功能,可以快速找到多人與單人電子郵件址關連,或多人保存相同電話但地址不同的資料等。從以往的社群網路關係分析,到現在的銀行、工廠都在使用大量的資料作分析,找出效益,大數據是一直不斷在演進的。

 

而圖形化資料庫則開始逐漸上了熱搜,甚麼是 Graph Database? Graph Database 是由 nodes edges 所組成的集合,用來定義各種類型的關聯,如社群網路關係等等。許多有經驗的數據分析師,會使用工具搭配 Graph Database 來做分析,以下介紹一個輕量級資料的 Graph Database 給大家,可以不需要使用到市面上常見的 Graph Database,如 neo4j等等。目前我也還在繼續研究,有興趣的同仁可以一起探討。

 

 

    Microsoft SQL Server 2017 版本開始加入 Graph Database 的功能,安裝完此功能後,在SSMS中可以看到多一個Graph Table的分類。

    Table 中的資料定義大概儲存如下。
   
   舉一個情境來套入 Graph Database:民眾與 城市的關係探討。
   則將會設計 民眾與城市為 node 資料表;而【民眾住哪】則是民眾與城市的一種關係 (edges),【民眾想去哪】也是一種關係,【民眾常去哪】則是另一種關係。
   以此類推,我們可以從中找出許多關係來做分析與應用。
 
   
 
 
黃雨謙