Word合併
NET 實作合併Word檔案-初步了解
2020/12/07 09:14:59
0
1703
前言
在談到word(.docx)合併時,我們先需要知道,其實word本身是由一堆xml組成的,如附圖。
ps.直接對.docx進度解壓縮,即可得到上述的資料夾。
相反的,若需要將xml結構轉變回.docx檔的話,也可以將相關xml結構壓縮,然後在將副檔案.zip變更成.docx,如附圖。
正題
接下來我們進入正題,因為要合併word內容時,剛只是單純將xml的內容copy過去時,有時會出現合併後的word檔無法開啟,或者是有些合併後的資訊不會出現如附圖。
會出現上述的問題的幾個原因一般為
1.xml結構出現問題,可能是xml參考的ID對應不起造成,也可能是xml少了對應的檔案
2.合併時xml的id衝突了(A檔案跟B檔案有相同的xml ID)
若合併成功,則會發現word的內容合併在一起,則時在看一下他的xml結構原則上就不會有剛說的合併後的word檔出現的問題1、2了。
進階
若合併的檔案裡有特殊符號或圖片的話,除了xml的內容合併外,還要針上特殊符號及圖片作額外的處理
附上合併前的檔案內容及合併後的結果
總結
word合併若透過程式合併的話~需要注意的地方很多,尤其是word檔裡有圖片、特殊符號等等,這樣的話就不能只是單純將xml的內容作合併而已,
還要去找出他對應的實體檔案一併作合併。