php发展

首页 » 常识 » 问答 » 胡恒数据库建设与清史研究
TUhjnbcbe - 2021/4/7 17:38:00
白癜风饮食忌口 http://disease.39.net/yldt/bjzkbdfyy/6116951.html

摘要

清史数据库建设在近二十年内取得了突出的成绩,科研机构的推动与商业公司的运营是两大动力。清史数据库建设及随之而来的量化史学研究克服了传统研究缺乏系统性数据或数据缺失严重等弊端,为计量方法的应用提供了相当便利的条件,但也将带来史料运用与理解方面一系列新的问题。为应对清史数字化发展进程,有必要建设数据共享平台,并将公益与商业开发适度结合,但于此同时,在数字时代更要重视传统史学的训练。

作者简介:

胡恒,年生,中国人民大学清史研究所副教授。

自20世纪90年代以来,随着信息化、电子化、网络化给人类社会带来的全面冲击,史学领域数据建设开始逐渐兴起,一批重要的研究史料被陆续以各种形式电子化并被制作成服务于不同对象的数据库,从而极大地改变了史学的生态,并引起了史学信息获取方式的变革。如今多数年轻学人已习惯于通过数据库的形式获取电子资源,从而使得年轻一代的史学写作方式与前代学者相比,出现了一定程度的代际差异。对这一变革所带来的利弊,学术界仍然存在相当大的分歧。[1]

清朝是距今最近的一个传统王朝,向来以史料丰富著称。自21世纪初启动“清史工程”以后,清史文献的整理成为四大基础工程之一,一大批文献资料被制作成数据库或影印出版,促进了整个清史学界在21世纪初十多年的持续繁荣,目前已建与在建的关于清史资料的数据库在各个断代史中数量可能是最多的。对清史研究而言,数据库以及随之而来的量化研究因在一定程度上克服了之前各代常常存在的缺乏系统性数据、数据缺失严重等弊端,具备一定的“大数据”基础,为数据库的建设与计量方法的应用提供了相当优越的条件。这一领域的研究虽进展迅速,但迄今为止,尚未得到系统的总结。[2]本文仅就笔者目力所及,针对数据库建设与清史研究的关系谈一点浅见,难免挂一漏万,不当之处,敬祈方家指正!需要说明的是,本文主要针对的是目前已上线的较重要的各类数据库,未公开发布的不在之列。

清史研究的最大优势在于史料的丰富程度。戴逸先生为“清史工程”《文献丛刊》所做的“序言”中,曾将清史文献的特点概括为“多、乱、散、新”,文献典籍“至清代而浩如烟海,难窥其涯矣”[3]。仅就刊印下来的典籍而言,已堪称汗牛充栋,更不必提及大量以手稿、文书形式存在的未刊文献。

为便于检索、利用清史资料,早期学术界往往通过编写索引、年表等工具书的形式来方便搜集信息。这类工具书分为两类,一类是检索型工具书,一般只提供查找文献信息的线索,不直接回答所要查询的内容,主要指书目、索引等;一类是参考型工具书,一般不提供资料线索,仅简要提供回答问题的知识,主要指各类字典、词典、类书、年鉴、图录、表谱等等。[4]当时学术界比较重视工具书的编纂,取得了很大的成绩,比较重要的检索型工具书有中国社会科学院历史研究所与中国人民大学清史研究所合编的《清史论文索引》(中华书局,年)、杨廷福、杨同甫编《清人室名别称字号索引》(上海古籍出版社,年)、中国人民大学清史研究所、中国社会科学院边疆史地研究中心合编的《清代边疆史地论著索引》(中国人民大学出版社,年)等等;参考型工具书有章伯锋编《清代各地将*都统大臣等年表(-)》(中华书局,年)、魏秀梅编《清季职官表(附人物录)》(中研院近代史研究所,年)、钱实甫编《清代职官年表》(中华书局,年)、《中国历史大辞典》(清史卷)(上海辞书出版社,年)、朱金甫、张书才主编的《清代典章制度辞典》(中国人民大学出版社,年)、中国人民大学清史研究所资料室编《清代中西历表(-)》(中国人民大学出版社,年)、江庆柏编《清代人物生卒年表》(人民文学出版社,年)等。[5]这些工具书,包括老一辈学者用以记录资料的卡片,与今天的数据库具有很大的相似性,只是表现形式差别较大而已。那时也开始利用这些年表做一些量化分析,只不过数理统计依赖于手工而已,如魏秀梅利用她所编写的《清季职官表》,连续在中研院《近代史研究所集刊》上发表了《从量的观察探讨清季布*使的人事嬗递现象》(第二期,年)、《从量的观察探讨清季按察使的人事嬗递现象》(第三期下册,年)、《从量的观察探讨清季督抚的人事嬗递》(第四期上册,年)等文章。

20世纪80年代以后,随着信息技术的发展,以网络环境搭建清史数据库的工作就开始了,台湾是这一领域的先行者。年台湾中研院历史语言研究所为“史籍自动化”计划的延伸而开始了“汉籍全文资料库计划”,目标是收录对中国传统人文研究具有重要价值的文献[6],其中,清史文献成为这一计划的重要组成部分。这一领域标志性的事件是年上海世纪出版集团上海人民出版社、香港迪志文化出版有限公司推出的《文渊阁四库全书》电子版,迅速受到学术界的欢迎。

21世纪以后,随着网络技术的发展,尤其是个人电脑用户的剧增,使得数据库的建设迎来了前所未有的发展契机,史学类的数据库建设也日渐兴盛。清史研究资料的庞大,为数据库的大规模建设提供了良好的契机。借助文献资料的大规模整理与检索手段的引入,学者可以更快地掌握某一领域较为全面、丰富的学术资源。清史数据库建设还有另外一个优势在于系统性史料的留存较为显著,具有较好的数据基础。清代的制度建设颇为严密,在两百余年的*府实践中,留存了一些具有连续性、系统性的资料。这些数据相对来说制作标准比较统一,将其处理为数据集较为容易。譬如清代户部所积累的人口、土地数字就是比较连续的,粮价数据可为清代经济史的研究提供足够数量的可应用现代经济模型的数据系统,雨雪分寸的资料可以为研究清代气候变化提供相当精准的定量基础,《缙绅录》提供了相当完整的清代官员的出身、籍贯、任职时间等标准化的数据。

因是之故,近一二十年来,清史数据库建设发展迅速。台湾起步较早,大陆近些年发展迅速,海外数据资源零散但十分丰富。依照通常对数据库分为的检索与计量两类[7],目前检索型数据库数量最多,已形成了基本涵盖清史的基本文献数据库与专题文献数据库齐头并进,共同发展的繁荣态势。所谓的基本文献库,指的是清史领域最基本、最常用、最重要的文献及其集成,包括档案、实录、*书、地方史志等等;专题文献数据库则多以纸本资料集为依托并结合学术界已有的研究而制作,如清代权威人名档等等,其中既有若干档案保管机构出于档案整理的便利而进行的数据库建设,也包括各科研单位基于自身研究优势所建设的各类专题数据库。前者覆盖面广,几乎为多数清史研究工作者所使用;后者则专业与特色比较明显,往往建立在前期丰硕的研究成果之上。

档案是清史研究的生命。台北中研院史语所的“明清档案工作室”从年开始将所藏“内阁大库档案”数字化,年起提供网络线上阅览和复印服务[8],只是目前大陆地区开通账号使用权限的高校与科研院所还为数甚少,但可以进行档案目录的检索。台北故宫保存的档案资源十分丰富,该机构早年即已开始数字化工作,并建立了相当完备、自成体系的数据库系统,包括清代宫中档奏折及*机处档折件全文影像资料库、清宫奏折档台湾史料目录、清代权威人名档案资料查询、大清国史人物列传及史馆档传包传稿资料库、清代文献档案总目、同人辑清史书目。台北故宫的数据库是以该馆丰富的清史档案馆藏为基础的,收录的多数资料为该馆所独有,且设计精良、界面友好、权威性强,目前已成为清史工作者必须常常查阅的权威数据库。该数据库在大陆高校和科研单位使用率尚不高,多数无法进行全文影像的查阅和复印,但可以进行档案目录的检索。此外,台北故宫还对中国第一历史档案馆所藏的清代满汉文朱批奏折汇编、活计档作名建立了目录检索系统。[9]

中国第一历史档案馆是清宫档案最大的收藏机构,从本世纪初清史工程启动以后,中国第一历史档案馆将为纂修清史提供馆存档案整理作为工作的重中之重,为此专门设立整理规划,对该馆所藏档案进行系统的整理、编目、扫描、拍照工作。从年10月开始为期一年的清代档案数字化试点工作,又成立了“清代档案数字化试点工作小组”等机构,制定了《中国第一历史档案馆清代档案数字化试点工作实施方案》[10]。经过近十年的努力,中国第一历史档案馆的数字化工作取得的进展是非常明显的,阅档条件也在逐步改善。目前,该馆馆内已建立了可供查阅的档案系统,其中收录的数据库主要有该馆所藏的朱批奏折和录副奏折,也包括部分户科题本、刑科题本、上谕档、随手档,也包括清代灾赈档、内务府奏案等,《清实录》与《清会典》等史料也同机提供检索[11],为研究者提供了较大的便利。目前这批档案同时在国家清史编纂委员会“数字图书馆”中收录。只是两者利用起来仍有很多不便,前者只能在中国第一历史档案馆馆内查阅,无法远程登录,对于京外学者尤其不便;后者则主要是为参加清史纂修工作的专家提供阅档服务,涵盖范围极其有限。将来条件成熟时,如能将这一系统建设为可远程登录、查询的开放型数据库,相信对整个清史研究的推动意义是无法估量的。值得一提的是,中国第一历史档案馆从年起逐步在官方网站上分期分批开放馆藏数字化档案目录,首批在网站已推出汉文朱批奏折档案目录[12],尽管离学术界的需求还有很大距离,但毕竟已是一个可喜的进步。另据爱如生公司

1
查看完整版本: 胡恒数据库建设与清史研究