數位化流程

中央研究院歷史語言研究所(以下簡稱:史語所)典藏清代內閣大庫檔案約三十一萬件,包括詔令、題奏、移會、賀表、三法司案卷、實錄稿本、各種黃冊、簿冊等。

史語所自民國十八年購入此批檔案始,因環境與時代變遷,或斷或續,整理工作持續至今。民國九十年始,史語所參與中央研究院國家典藏數位化計畫,將內閣大庫檔案的整理納入重點計畫之一,主要目的在於尋求更多的人力、物力,加速檔案的整理工作、減緩檔案的毀損、促進檔案的開放,提昇檔案的利用價值,並同時盡到對國家財產保存與維護的使命與責任。

檔案的整理是一連串嚴謹的程序,牽涉學術、技術與經驗的整合,從實體到數位,要如何完整妥善地將檔案存在的價值以及歷經時空轉換不同的意義予以呈現並滿足不同使用者、研究者的各種需求,是一個艱難的課題。在此以史語所明清檔案工作室整理內閣大庫檔案,以及近年來因應時代科技的發展趨勢進行數位化作業的經驗,簡介內閣大庫檔案的數位化流程,提供相關的檔案典藏單位進行參考。

史語所明清檔案工作室的人員,分為「整理組」和「摘要組」,整理組主要負責檔案的整理、修裱等工作,摘要組則進行目錄摘要與著錄等。


第一階段:實體整理階段

檔案包與尚未開啟的檔案箱

一、原件檢視
檢視原件的實體狀況是整理工作的第一步,主要目的在於決定後續處理的方法。

原件檢視
二、原件掃灰
用軟刷一一刷清原件上的蠹魚、蟲卵、霉斑及灰塵。

掃灰
三、拼湊、綴補
檔案原件如果較為完整,原則上還是會經過補洞、噴水潤平等整理過程。

原件拼湊、綴補
若有破損或殘缺,就需要修補、裱褙。因為原本整齊的一件檔案,在經過時間與多次搬移、整理,可能造成頭尾錯開、斷裂,所以需要將殘件與碎片進行拼湊、綴補,以盡力維持檔案原件的完整性。小型的碎片,以背面墊稍大片棉紙的方式,加以綴補;若是摺件掉頁則進行拼湊。整個拼湊、綴補的過程所需用到的工具有:楮皮紙、自製漿糊等等。

四、裱褙
根據原件的實體狀況與目的,選擇裱褙的方法,一般以簡單的托裱為主。

裱褙
裱褙的方式分做濕裱和乾裱,如果原件所用墨跡不致暈染,可採用濕裱,即在原件背面刷上漿糊;若是原件有碎片、或是墨跡可能暈染等,則採用乾裱,即在托紙上刷上漿糊,再將原件貼於其上。目前內閣大庫檔案採用乾裱方式為主。
修裱採用傳統方式,利用手工調製的漿糊,然後進行裱褙的工作;如為腐蝕嚴重的檔案,則使用甲基纖維素揭除舊裱,再進行裱褙。

手工調製漿糊
裱褙通常會先在檔案原件上噴水潤平,然後在托紙上塗抹漿糊托於檔案原件之下。裱褙後的檔案必須在特製的木質大牆上進行晾乾(陰乾)。

晾乾
待檔案陰乾後進行下牆裁方,即檔案撕離特製的牆面之後進行裁切,照摺件原本的樣式折疊,然後將頭尾兩頭切掉,天地留下一定的比例。

下牆
整個裱褙的過程所需用到的工具有:楮皮紙、棉紙、宣紙、絹綾、自製漿糊、裁刀、大牆、竹啟子、鑷子、尺等。

裱褙工具
五、原件校核登錄
查核檔案次序的正確性和完整性,再予以鈐印典藏章,進行登錄編號。鈐印所用的印泥,為配合典藏檔案的脆弱而特製,成本較為昂貴。

鈐印打號
六、上架
原件登錄後,以中性紙逐件包裝,待相當數量時,再裝入典藏箱中,封上典藏標籤,進行上架,保存在恆溫恆濕條件的庫房中。溫、濕度的控制符合國際標準,即濕度在50~60之間,溫度則在18-20度C之間。

恆溫恆濕庫房
古代線裝書採用平放而非立放方式,摺式的文件也是如此,較適宜平放,因此每份文件會以中性紙包裹,再依檔案編號順序,或五十件一包、或三十件一包(依據檔案的厚薄),存放在紙盒裡。於紙盒外側打編上流水序號,以方便調閱。裝盒亦可避免地震傾倒所造成的重新整理等問題。

摺式檔案平放於無酸紙盒

第二階段:數位化階段(分為三方面同步進行)

第一方面:影像處理

一、原件掃描、數位攝影
考量檔案的數位化目的,擬訂數位影像的規格;再依原件的實體整理狀況決定製作數位影像的方法,分為掃描法與數位攝影法。掃描圖檔的規格為典藏級300dpi,以下再由系統直接降階轉存為150dpi或72dpi,做為公共資訊級。一般摺件多用掃描方式進行數位化,大尺寸的檔案或卷軸則採用數位攝影。

檔案掃描數位影像拍攝
掃描時色彩形式標準分做灰階與全彩,取決於掃瞄出來的影像效果是否清晰可讀。其判別原則是:原件若有長霉、黑斑霉斑、泡水、水漬、摺件接縫處蓋關防章影響到原件上的文字內容等情況時,採用全彩的形式進行掃描;一般的情況則採用灰階。掃出來的影像,經過校對後若發現效果不好,則會提高標準。

掃描的單位以頁為計算,即摺件攤開每二幅算一頁。這是因為每份摺件厚薄不一,頁數也不一,因此不適合以件做計算單位;並且掃描平台以A4為常見,大小亦較為適合,經過系統合檔之後,就可以一頁一頁翻看。

數位影像的拍攝使用柯達DCS420相機,拍攝後的數位影像,直接連接電腦進行圖像編輯處理。為了達到原貌重現,數位攝影圖檔的規格設定在300dpi,realpixel,使攝影後的影像能接近原圖;拼圖也力求完美,檔案上不論字跡、水痕都力求一致。此外,為了讓數位攝影所拍出來的圖像能夠銳利清晰,便會在被攝的檔案上貼上吸鐵,事後再以圖像編輯軟體將吸鐵的影像修掉。至於掃瞄的部分則是系統自動合檔,無須人工接圖。

二、數位影像校對、修稿
校核影像的正確性、完整性與清晰度,主要查核是否有漏頁、重複頁、少字、缺字,必要時進行修稿。

影像檔案校對
三、數位影像後製作
包含影像接圖,即掃描法的系統自動合檔與數位攝影法的人工接圖、合檔、備存,將掃描好的典藏級數位檔進行降階轉檔、嵌入浮水印等技術的執行,使數位圖檔成為可實際提供予使用者的數位影像。


第二方面:目錄建置

一、目錄檔著錄
提調檔案,根據「明清檔案著錄規則(草案)」,以件為單位,繕寫提要目錄。提要目錄必須記載:
  1. 檔案的具奏人、官銜、時間等「檔案內容的資訊」;
  2. 檔案是完整或殘缺、裝潢、裱褙與否、保存狀況等「檔案載體狀況的資訊」;
  3. 摘要撰寫人、檔案將來運用等「檔案管理的資訊」。
另外針對檔案的內文進行60字的摘要。此外,原始的內閣大庫檔案已有當時所記錄的摘要,即所謂「貼黃」,將會全文輸入。在實際執行上,因為檔案的複雜程度各有不同,需要時間加以判讀,因此整理組可能會先以手寫摘要,再詳細著錄於廠商依需求所開發出來的著錄系統中。

撰寫提要
二、目錄檔校對
摘要進行線上著錄之後,便會系統列印校對報表,進行校對與修正。由於明清檔案工作室同仁皆已在相關工作上具有資深的經驗,並且工作嚴謹,因此採用自校的方式。


第三方面:加值分析(此部份由摘要組進行)

一、權威檔著錄
  1. 決定權威檔性質:人名、地名。
  2. 由檔案中摘錄人名與地名。
  3. 選擇考證與參考資料(由研究人員提供),依考證性序列,並查找、記錄資料來源與位置。
  4. 根據「明清檔案人名權威檔著錄規則(草案)」、「明清檔案地名權威檔著錄規則(初稿)」(各規則由本所相關領域之研究人員研擬),進行資料的考證比對並著錄。

二、權威檔校對
分為自校與互校。系統列印校對報表或線上校對,並進行修正。


第三階段:應用階段

一、系統連結

連結影像檔、目錄檔、權威檔,執行系統功能運作,提供檢索,過程中並進行權威控制。目前已可以網上閱讀目錄檢索,影像部分則需申請付費使用。

二、開放利用
研擬檔案閱覽規則,以系統控管方式,提供使用者進行檢索、閱覽目錄及閱覽全文影像。


文稿編撰:中央研究院歷史語言研究所明清檔案工作室
文稿整理:中央研究院歷史語言研究所明清檔案工作室
國家型科技計畫–內容發展分項計畫
圖片提供:中央研究院歷史語言研究所明清檔案工作室
國家型科技計畫–內容發展分項計畫