[Graph Database] 數據分析的輕量工具 - SQL Server 2017 with Graph Database
[Graph Database] 數據分析的輕量工具 - SQL Server 2017 with Graph Database
簡介 |
介紹微軟新加入的圖形化資料庫功能,讓有經驗的同仁不需要再另外建置額外環境,快速做分析。 |
作者 |
黃雨謙 |
Industry 4.0帶動製造工廠轉型智能工廠。由一堆感控裝置組件系統使用物聯網產生巨量資料結合AI技術、數據分析,讓早期一板一眼生硬製造流程轉型為具有感覺的軟式、適應性、效率性作業模式。而技術基礎其中之一就是大數據(巨量資料Big Data)。巨量資料透與電腦為媒介進行探勘、解析、比對、分析、統計發掘客觀性、顯著性具有影響性的關鍵資料。模仿日常生活中大家儲存文件資料時可使用資料櫃來保存文件、分類等等,數位資料作為儲存資料稱為資料庫。而今資料庫又分關聯型資料庫(SQL)與非關聯型資料庫(NoSQL),關聯型資料庫,例如:Oracle、Microsoft SQL Server、MySQL、PostgreSQL…。非關聯式資料庫(NoSQL)有文件儲存、圖形資料庫、鍵-值、主機式服務、多資料庫、時序型資料、物件資料庫、列儲存。今天就以圖形資料庫來探討大數據應用。
“關係”是資料的主要價值就適合用圖形資料庫。圖形資料庫使用Node來存放資料實體利用Edge來存放實體間的關係。一個節點擁有的Edge是沒有限制。在應用上,圖形資料庫能使用關係(Transaction)以幾乎即時找到雙方節點。舉例來說,在圖形查詢功能,可以快速找到多人與單人電子郵件址關連,或多人保存相同電話但地址不同的資料等。從以往的社群網路關係分析,到現在的銀行、工廠都在使用大量的資料作分析,找出效益,大數據是一直不斷在演進的。
而圖形化資料庫則開始逐漸上了熱搜,甚麼是 Graph Database? Graph Database 是由 nodes 與 edges 所組成的集合,用來定義各種類型的關聯,如社群網路關係等等。許多有經驗的數據分析師,會使用工具搭配 Graph Database 來做分析,以下介紹一個輕量級資料的 Graph Database 給大家,可以不需要使用到市面上常見的 Graph Database,如 neo4j等等。目前我也還在繼續研究,有興趣的同仁可以一起探討。
Microsoft 於 SQL Server 2017 版本開始加入 Graph Database 的功能,安裝完此功能後,在SSMS中可以看到多一個Graph Table的分類。