據島內“中央社” 等新聞媒體報道臺灣﹃中研院﹄的數位數據庫已開放并以申請會員制方式開放島內免費授權使用
這套系統是由臺灣“中研院”歷史語言研究所︵簡稱史語所︶組織建立的史語所是著名的史學研究資料的重地以嚴謹扎實豐厚而著稱現有專任研究人員五十多人分四個學術組九個專題研究室六個工作室其︽中央研究院歷史語言研究所集刊︾傅斯年圖書館數位數據庫在史學界是非常有影響力的
傅斯年圖書館最早建立于一九二八年一九四九年遷到臺灣一九六〇年在美國的援助下興建了現在依舊使用的四層建筑并為紀念史語所的已故所長傅斯年先生(曾任)由胡適之先生將其命名為傅斯年圖書館此館收藏范圍以歷史學語言學文字學人類學以及古籍考訂學為主有關中國古科技史文獻生命醫學文獻亦甚豐富當下館藏總計約七十多萬冊檔案二萬余件(人物檔案包括手稿照片信件)期刊報紙三千多種現刊一千多種對俗文學資料的收藏是其館藏極具特色的一部分有一萬二千件二萬余目時間上溯至清乾隆年間地域遍及全中國至二〇〇四年八月已被數據庫收錄完畢
已經建立并開放的數位數據庫則是﹃中研院史語所珍藏歷史文物數位化典藏計劃﹄的具體實施上世紀八十年代中期由史語所和傅斯年圖書館著手進行他們運用數位化方式重新整理珍貴的典藏文物“期望透過嶄新的研究平臺跨越時空與地域提供漢學界更豐富優質的研究素材”到去年底史語所將多年來典藏的考古資料 (包括殷墟兩周考古及臺灣考古)拓片與古文書 (含甲骨文拓片青銅器拓片佛教造像拓片遼金元拓片漢墓畫像拓片居延漢簡)善本圖書中國西南少數民族文物明清兩朝檔案等整理成包括“漢籍電子文獻”“內閣大庫檔案﹄等十六個典藏數據庫暨系統僅“漢籍電子文獻”就包含整部二十五史整部阮刻十三經超過兩千萬字的臺灣史料一千萬字的大正藏以及其他典籍合計字數一億三千萬字并以每年至少上千萬字的速率增長
這十六個數據庫總計提供近四億字史料電子全文一百多萬面數位影像五十六萬多筆收藏文物的數據等信息目前它是“迄今最具規模的中文古籍數據庫也是目前網絡中資料整理最為嚴謹的中文全文數據庫”比如“二十五史”所選用的錄入底本是臺灣鼎文公司翻印的大陸中華書局點校本(臺灣稱為“新校本”)多名臺灣學者參與了校訂工作每部史籍都經過至少四次校閱
在正式開放之前此數位數據庫已做了四年多的測試性開放使用人次總共累計達十九萬人次點閱次數超過六百八十萬次平均每天都有超過四千六百次的點閱記錄據豆瓣網“愛讀書的熊”特別推崇在“漢籍電子文獻”的一級欄目最后有一個不太引人注目的“人文資料庫師生版”是為普及文史教育而向臺灣大中小學師生免費開放的其中包括了許多文史研究的重要典籍占整個漢籍資料庫文獻的一半
另外史語所創所以來的文書檔案包含了人事采購公務信件工作計劃工作報告會議記錄等一九九六年開始整理現已進入“檔案數位化典藏計劃”
特別值得重視的是陳國棟(史語所研究員兼傅斯年圖書館主任)林妙樺(史語所傅斯年圖書館館員)于二〇〇四年在中科院牽頭主辦的“兩岸三院信息技術應用與交流研討會”上提請注意數位典藏系統一是建制多元平臺以提供多元服務比如整合串連各種檢索系統之數據再以跨平臺之電子出版型態進行出版二是數位典藏系統的各項經驗傳承強調隨著數據量擴增更需經驗的傳承否則系統的后續維護及運作效能也將大受影響他們提出在數位典藏工作的規劃中一要考慮多元媒體的儲存機制比如無論用何種媒體都必須考慮其保存年限及儲存環境等問題數字媒體更需考慮其改版或升級等相關問題二要依其保存及使用年限予以定期重制以避免因檔案毀損或規格變更等情況而影響數位影像的儲存及讀取三要異地儲存可預防一旦發生災難則仍難逃無典藏備份的后果四是對原件數位化也不得減少其維護和修復費用因為數位化復制品對于研究者而言仍無法取代原始典藏