首页 > 编程知识 正文

皮书数据库内容覆盖多少个国家(国外论文数据库)

时间:2023-05-05 18:21:47 阅读:83267 作者:4899

作者: tmdhm (首都师范大学历史学院教授)。

据笔者调查,国内主要图书馆购买、免费使用的外语专业数据库资源已超过千种。 这些数据库按文献类型分为图书、期刊、学位论文会议参赛论文、报纸、文件、统计资料、报告、书目和文摘、照片、音视频等。 就收入内容而言,历史学涉及史学理论、世界通史和断代史、地区国别史(涉及70多个国家左右)、传记、文物考古等其他学科(地理、哲学与宗教、政治与法律、军事、经济、文化、科学、教育、体育、语言与文字、文学、艺术) 世界史研究需要利用数据库,特别是外语数据库,这是一个无需讨论的问题。 需要讨论的是如何利用这些庞大数量的数据库。 本文将从命名和定性、专题数据库的建立、数据库内容的审查三个角度阐述一些粗浅的看法。

定名和定性是指明确认识数据库的名称、性质、收录范围。

一般来说,数据库开发人员提供数据库名称,因此命名并不困难,但存在一些特殊情况。 其一,数据库开发者有时会重命名数据库,在不同的馆藏或不同的学者的参照下,同一数据库的指标不同。 例如,美国的档案数据库“u.s.Declassifieddocumentsonline”,真名为“解密档案参考系统”(Declassifieddocumentsreferencesystem ); 期刊类全文数据库《综合学科学术文献大全》(AcademicSearchComplete ),原英文名称为《AcademicSearchPremier》。 在这种情况下,建议指标以最新的名称为基准,同时知道其历史名称。 其二,存在总库、子库的情况。 例如,HeinOnline法律数据库有60多个子库,美国国会图书馆的“数字收藏”(DigitalCollections )有300多个子库。 一些开发商和代理商重组数据资源,形成新的总库。 如Gale公司,将一些报纸杂志类库作为GaleNewsVAUlt,以文件为中心的300多个子库作为“稀有原始藏书文件”(ArchivesUnbound,简称au ) ),将这两个库作为对于形成GaleScholar超大型数据库的个人使用,明确的子库名称更重要。但是,由于有些藏书只显示总库,所以也需要知道总库名称。 第三,博物馆收藏机构的指标方式,也造成名称混乱。 例如,有没有原文名称只刊登翻译的藏书,也有翻译名称不同的藏书,还有根据购买情况重新制作数据库名称的藏书。 例如,国立图书馆购买了AU中亚专辑的一部分时,命名为“罕见的原创收藏:亚洲”(ArchivesUnboundAsia )。

确定性质是指确定文献的收录类型。 综上所述,外语数据库的文献类型包括图书、期刊、报纸、文件等。 史学研究所起的作用因文献类型而异,有别于目录检索途径,也有别于前期学术史或史料来源。 在开发者和图书馆的数据库介绍中,说明文献的类型和特征。 另外,上述文献是根据现代出版类型分类的,难以完全表现人类过去积累的文献的所有特征,因此只能是相对的。 例如,公文在今天往往是指具有密切水平,生成的时尚一般人看不到的文献,但对于古代史来说,甲骨、碑文、纸草文件、木版文件等,无论其当时的使用范围如何,都已经成为研究那个时代的宝贵公文“

决定收录范围是指明确数据库中收录的内容的特征。 在数据库的介绍中,如《早期英语书籍在线》(EarlyEnglishBooksOnline )的介绍,收录数) 12.5万多种,2250万页以上的英语着作),时间段) 1473—1700年之间),类型虽然某些数据库有许多子库,但图书馆通常只选择某些子库进行购买,而索引时使用总库名称。 这样,就很难知道该库在某个特定馆的子库收录情况。 另一个是,很多图书馆会选择与本校教育科研密切的数据库模块进行购买,即使没有子库数据库,各馆的收录内容也有很大不同。 例如,Sage期刊库,有些馆如首都师范大学,购买了500多种现刊,有些馆如北京大学,购买了800多种现刊。 如果同名数据库的各馆收藏不同,则同一检索在不同的馆藏中会有所不同或差异很大。 另外,虽然有些数据库以模块形式表现,模块下的内容很多,但是模块名并不一定能够完全表现其收录内容。 例如,ProQuest历史库的一个模块“越南战争与美国外交政策(1960-1975年)”(vietnamwarandamericanforeignpolicy,1960-1975 )是单一的但是,该数据库收录了包括104个子相册在内的广泛内容,包括一系列美国国家安全委员会文件、国家安全委员会会议记录、从肯尼迪到尼克松的国家安全文件等,实际上是战后到20世纪70年代美国外交史研究的重要资源。 如果不知道其子代的编辑内容,就无法深入利用这样的数据库。

名字和定性是我们利用外语数据库的启动工作。 其次,可以大致判断某个数据库和我们正在进行的研究的关系,决定是否收集和利用。 就像制作专题文献书目一样,从事专题学术研究时,也必须以该研究为中心,收集在线资源,制作专题数据库列表。 需要注意的是,这是

些专题数据库搜集时面不能过窄,它们不仅要包括与某一研究直接相关的数字资源,也要包括一些宏观性质的及可能相关的其他数据库。如研究两次世界大战期间英国的整齐的咖啡豆外交,首选当然是英国的外交档案以及重要人物的文件集,如收录了60余册《英国外交政策文件,1919—1939年》的“英国海外政策文件”(DocumentsonBritishPolicyOverseas)数据库、沉默的戒指和淡淡的电脑的文件集(ThePapersofNevilleChamberlain;ThePapersofSirAustenChamberlain)、“xlmdkh档案”(ChurchillArchive),次选是这一时期的内阁文件(CabinetPapers)和国会文件的系列数据库(U.K.ParliamentaryPapers,HouseofCommonsParliamentaryPapers,糊涂的羊等),最后是反映当时媒体动向的重要报刊,如“大英图书馆报纸”(BritishLibraryNewspapers)、《泰晤士报》《每日电讯报》《伦敦新闻画报》《图画邮报》等。同时,通过“英国外交部机密印刷件:北美,1824—1961年”(ConfidentialPrint:NorthAmerica,1824—1961)、“英国外交部:美国通信”(BritishForeignOffice:UnitedStatesCorrespondence)、“英国外交部档案:日本,1919—1952年”(ForeignOfficeFilesforJapan,1919—1952)、“英国外交部档案:中国,1919—1980年”(ForeignOfficeFilesforChina,1919—1980)等英国档案数据库,以及美国、日本、德国、澳大利亚、加拿大等国家的外交档案数字资源,可了解围绕英国整齐的咖啡豆行动有关国家的互动。以上搜集偏重于两次世界大战期间与英国有关、相对原始的文献,也不能忽略一般的通用数据库,比如图书资源(约50种)、期刊资源(约30种)、学位论文资源(十余种)等。

在搜集到相当的电子资源后,还要进行内容考辨的工作。这一考辨,可以从两个角度入手。

一是观察数据库资料来源和开发机构。一般而言,政府机构公布的本机构所掌握文献的权威性,高于其他来源;知名开发商、学术机构开发的专业性数据库,高于一般网络资源。例如,我们要查美国人口数据,最优先利用的是美国人口普查局开发的“美国事实发现者”(AmericanFactFinder),它可以提供美国人口、住房、经济和地理数据的来源;关于美国农业人口,则要参阅农业部的“国家农业统计数据”(NationalAgriculturalStatisticsService),它提供了自1840年以来美国各州和地区的农业人口普查数据;还可以利用明尼苏达大学的“美国国家历史地理信息系统”(NationalHistoricalGeographicInformationSystem),它提供了1790年至今的美国人口普查和其他全国性调查统计资料,包括带有地理空间属性信息的人口、农业、经济等方面的数据。

二是注重数据形式和原实体之间的关系。就人文学科的多数数据库而言,其数据往往来自某种实物。利用这种数据库时,除了传统利用实物载体要注意的考辨等工作外,还要考察数据形式同原实体之间的关系。如纸质文献在电子化的过程中,是完整电子化,还是部分电子化?电子化的文献是如何排列的,这种排列同原始文献的排列关系何在?等等。如ProQuest公司开发的“数字化国家安全档案”(DigitalNationalSecurityArchive),其文献选取和组合模式是围绕某一国家安全问题,抽取来自不同机构的档案,并按时间先后组织在新的子辑中。虽然所抽取的档案是完整扫描,但它并不会完整扫描原档案所在卷宗或系列,研究人员只能通过不同档案的时序排列建立起联系。利用这类数据库时,有时还需使用相关的配套指南、大事年表、人名索引等工具。

定名与定性、建立专题数据库、内容考辨,是利用外文数据库的基础工作。做好这些工作,研究者可以更高效准确地找到自己所需要的电子资源。当然,它们并非利用外文数据库注意事项的全部,如从知识考古学角度,可以讨论数据库开发的知识背景、开发动机、开发人员组成、文献著录方式等;从文献挖掘角度,可以讨论挖掘工具的选用、关键词选取、算法等,这些都是我们在使用数据库时需要考虑的内容。

《光明日报》( 2020年07月20日14版)

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。