亚洲历史资料中心的新课题与工作

国立公文书馆亚洲历史资料中心 浅井良亮

亚洲历史资料中心(以下简称“中心”)是建立数据库,通过互联网公布近现代日本与亚洲邻国相关历史公文档案的数字档案机构。截至2018年4月,已公布文件213万份,图片3087万张。

本报告将以具体事例介绍中心近年来所面临的各种课题及为解决这些课题而开展的工作。关于中心成立的经过和近年来的情况,已有另文介绍,请各位加以参考。[1]

1.扩大公布资料的范围

(1)战后资料的正式公布

2015年5月,在“回顾20世纪、构思21世纪世界秩序与日本职责的有识者恳谈会”(以下简称“构思21世纪恳谈会”)[2]第五届会场上,出现了这样的意见:在赞赏“中心作为提供战前日本历史资料的网站,至今在东亚获得广泛使用,对于历史认识问题与和解问题做出了很大贡献”的同时,也提出“能不能不限于目前的战前部分,也公布战后的‘和解’过程,向外界传递信息”的要求。[3]

根据这个意见,我们在这一年8月由构思21世纪恳谈会提交的报告里,在“在战后70周年之际日本应采取什么样的具体措施”的条目中,提议“目前选取的史料限定于第二次世界大战之前,今后有必要搜集、公布战后资料”,把亚洲历史资料的公布范围扩大到了战后。[4]

以“充实亚洲历史资料中心”这一提议为基础,2016年3月,在亚洲历史资料中心咨询委员会(以下简称“中心咨询委员会”)[5]上,讨论了“公布战后资料所需方针”。中心咨询委员会以此前提议为基础,对于准备新公布的战后资料,认为“有必要确定具体范围”,从内阁会议决定与国立公文书馆相关法令之间的整体性、国内外使用者的期望等角度进行了探讨。最终决定以“在今后一段时间内,公布对象‘大体为1972年前完成的史料’”为中心工作方针。

以中心咨询委员会的提议为基础,中心决定公布1945年到1972年间的亚洲历史资料,在外务省外交史料馆和国立公文书馆的配合下,从2017年开始正式公布战后史料。[6]在开始公布的第一年,由外务省外交史料馆提供了《战后外交记录A门:政治、外界、国际纠纷》中GHQ驻军及帝国宪法修订方面的资料,由国立公文书馆提供了从东久弥宫内阁到第三次吉田内阁时期(1945年8月至1952年12月)内阁会议、事务次官会议等会议资料为代表的5个资料群,并都通过中心的数据库予以公布。

(2)通过链接扩大信息提供范围

2012年12月,中心数据库公布的图片数量已经接近当初的目标3000万张,因此中心咨询委员会提出了“为扩大公布数据量而采取的具体方针”。其中指出,中心的职责应该指向“亚洲历史资料的枢纽”。具体方针是将国立公文书馆、外务省外交史料馆、防卫省防卫研究所战史研究中心(以下简称“三机构”)提供的资料数据库化并予以公布,又提出“今后应增加资料的提供,并构建链接其他机构数字资料的系统”。

根据中心咨询委员会的提议,中心开始与其他通过数据库公布亚洲历史资料的机构进行协商。最终在2013年5月,中心与琉球大学附属图书馆签订了系统合作协定,[7]中心的数据库开始以链接方式公布“宫良殿内文库”[8]

此处所说的链接方式,其机制是在中心的数据库中进行资料检索,根据检索结果阅览资料图片时,会跳转到协作机构运营的数据库内的相应位置上。因此在资料公布之前,有以下三个流程要做:①中心接受协作机构运营的数据库公布的资料群中的元数据;②把对方机构提供的元数据,按中心数据库中元数据的格式进行调整(此时对于需要追加的字段等,中心会设置新的元数据);③把经过调整的元数据上传到中心数据库中。

采用这种方式,不但有异于一般的跨库检索,能同时检索中心公布的其他资料群,还可由中心数据库规格的元数据完成高精度检索,并能经由中心来提高协作机构所运营数据库的利用率。

到2018年4月,签署链接合作协定的同类机构已经有6家(参见表1)。

表1 签署链接合作协定的机构(2018年4月)

表1 签署链接合作协定的机构(2018年4月)-续表

2.多语种检索

(1)打造英语检索体系

1991年的内阁会议决定,中心的目的之一是方便“普通国民及相关国家人民的使用”。这意味着中心在筹备阶段就确定了使用者不限于日本人。因此,针对海外用户打造一个多语种检索体系,是中心成立时就受到重视的一个课题。

在中心数据库中,我们把日语的元数据进行英译,使用英语检索数据库成为可能。英语检索系统自2002年6月启动,这是中心成立后第7个月的事情。[9]

关于英语元数据,日语元数据中的资料群、簿册、件名的标题(title)、制作者(creator)、机构介绍(organization)等部分为翻译对象。对于资料的分层性(hierarchy),也和日语版一样,重现了资料提供机构原有的分层结构,可以沿着分层来进行检索。

在构建英语元数据方面,我们每年进行数万件的翻译工作。关于翻译业务,由于仅靠中心员工难以完全解决,采用了竞标的方式选择翻译业者,并由中心对业者的翻译内容进行检查。

近年来,我们又听到了使用者的呼声:除了英语检索外,中心能不能提供中文或韩语等其他语种的检索服务?能不能把内容摘要(summary)翻译了?这些呼声,也证明了中心的海外使用者不断增加的事实。多语种化方面还存在各种各样的问题,目前还是优先充实英语检索体系。

(2)对译文的核查

在翻译数据的核查工作中,主要针对的是已存在正式译法的用语是否得到了正确的翻译,是否存在正式译法,译词是否具备正确性和统一性等问题。制作者和机构的介绍中很多时候存在以固有名词为中心的专业性用语,要具备很高的专业能力才能对其进行核查。

为了解决上述问题,中心定期召开亚洲历史资料中心数据核查委员会(以下简称“数据核查委员会”)[10],对译文进行核查。数据核查委员会对核查对象词就是否存在学术上的正式译法以及翻译是否正确、格式是否统一进行一一复核。

这里我们举“正院”的例子。从1871年到1877年设于太政官的正院,是太政官中的决策机构,也是管辖各省的部门。对于正院的英译,既有单纯音译的“Seiin”,还有表述其在太政官中定位的“Highest Political Organ”,以及相对于左院、右院而言的“Central Chamber”,这些译法在各种专业书中都有,并无统一译法。我们曾考虑使用“Cabinet”,因为正院是管辖各省的,与后来设置的内阁是一样的机构,但最后还是确定以“Central Council of State(Sei-in)”为正式译法。

通过数据核查委员会的复核后成为“亚洲历史资料中心正式译法”的词,会实时反映到中心数据库中的元数据上,并通过互联网特展等方式向社会公布。

3.提高检索功能

(1)打造字典功能

在对中心及其他机构的数据库进行检索时,有一个很大的问题,就是检索条件。也就是说,检索中使用的关键词,与登录为目录信息的元数据未必一致。

使用者在检索时使用的关键词,多为社会上的常见用词。这些关键词中,也有不少并非历史资料中实际使用的用语(史料用语),而是通过历史研究或教育、媒体所形成、普及的用语。而中心立足于资料原文主义,制作了元数据,因此对资料中的用语(史料用语)原样照录(包括笔误和误植)。

例如“明治维新”这一用语。明治维新这个词对应的是1868年前后日本的社会变化,在当时就有使用的例子。但在当时,也有很多场合使用的是其同义词,包括“御一新”及“百事御一新”等词。还有一些词与明治维新有紧密的相关性(相关词),例如“癸丑以来”“王政复古”等,不掌握这些情况,就难以顺利地检索明治维新的相关资料。

此外,外国的地名和人名,在音译为假名时规则未能统一,因此出现了一词多译的情况。比如明治初期美国驻日公使Charles E. DeLong一般译为“デロング”,但在当时的外交档案中存在很多有/无浊音的“デロンク”和“テロング”,[11]以及有/无长音的“デローング”和“デイロング”等情况。[12]不用说,对于用了后面这些译法的资料,仅使用“デロング”来检索,是无法找到的。

像这样,为了消除中心数据库中关键词与史料用语不一致的情况,有必要对检索功能进行强化。为此,中心把社会上的常用关键词设为检索基本用词,而对与此相关的同义词、相关词和一词多译,则进行了字典数据的强化。[13]

经过强化的字典,在使用检索基本用词时,屏幕上会出现“指定字典及译法进行检索”的标签,点击标签,就可以对数据库中登录的同义词、相关词和一词多译进行选择,还可以多选。这样一来,就可以得到包括同义词、相关词和一词多译在内的检索结果。

至2018年8月,已登录的基本用词约有1.1万个,同时还在进行用词追加及其内容的复核工作。

(2)亚洲历史资料中心地名人名事件辞典

为了解决上述检索用词方面的问题,我们于2017年开始运行“亚洲历史资料中心地名人名事件辞典”。这一内容,是以辞典形式介绍检索用关键词,还能向使用者介绍与关键词相关的同义词、相关词和一词多译。

在辞典的首页,按地名、人名、事件各设置一个按钮,点击按钮,就跳转到各辞典的选择页面上。在此通过下拉可以从门类和关键词中选择使用者感兴趣的词条。选择后点击“表示”按钮,用语解说页面就会显示出来。解说页面中除了对用语的简单解说外,与其相关的同义词、相关词和一词多译也会显示。此外,点击“使用该关键词进行检索”,还可以对使用了该用语的数据库进行检索。

辞典中登录的用语,原则上都具备上述字典功能。因此根据用语检索结果,可以打开“指定字典及译法进行检索”标签,进行再次检索,从而得到更广泛的检索结果。

(3)亚洲历史资料中心杂货铺

中心每年都举办数字企划展,称作互联网特别展。从2015年度开始,会在特定主题展之外运营具有资料检索导航功能的“亚洲历史资料中心杂货铺”[14]

2017年度,中心开始公布那些曾在战前日本的殖民地、占领地行政机构中工作过的官员的资料,称作“档案中的‘外地’和‘内地’:旧殖民地、占领地的人的回流”。

在“用表检索”页面,可以通过机构变迁表、年表来检索设在旧殖民地、占领地的行政机构。关于机构变迁表,使用者可以对想要检索的地区(台湾、朝鲜、“关东州”及满洲、萨哈林、南洋等),用下拉的方法进行选择,可以直观地看到详细的机构组成情况。如果点击机构变迁表中的部门名称,还可以跳转到相应的解说页面。

在“检索官僚履历”页面(见图1),可以直观地看到曾在这些行政机构工作过的官员的履历和工作地点。如果选择想查的机构名或官职,可以跳转到相应的履历页面,能够详细地了解其人的履历和奉职地区的变化。此外,在跳出的机构名和人名解说页面上点击“用本关键词检索”,则可以对使用了该关键词的数据库进行检索。

另外,中心还分别在2015年度和2016年度公布了“从档案看终战:复员和回国的记录”“从档案看战时与战后:统治机构的变化”。2018年度,中心计划举办以明治时期为主题的特展,以开展明治150年纪念活动。

图1 “检索官僚履历”页面

参考文献

牟田昌平、小林昭夫:《亚洲历史资料中心》,《情报管理》Vol.45,No.7,2002年10月。

《Archives》Vol.27,国立公文书馆,2007年3月。

内海爱子:《村山谈话与亚洲历史资料中心》,黑泽文贵编《战争、和平、人权》,原书房,2010。

国立公文书馆亚洲历史资料中心编《瞄准数字档案的尖端》,国立公文书馆亚洲历史资料中心,2012。

构思21世纪恳谈会编《战后70年谈话的争论点》,日本经济新闻出版社,2015。

波多野澄雄、大野太干:《国立公文书馆亚洲历史资料中心15年来的工作》,《情报管理》Vol.59,No.7,2016年10月。

大野太干:《如何理解日本的历史档案》,《档案》第16卷第1期,2017年6月。

波多野澄雄:《亚洲历史资料中心的16年》,《中央史学》41号,2018年3月。

黑泽文贵:《亚洲历史资料中心的设立目的和面向海外的传播》,《中央史学》41号,2018年3月。

熊本史雄:《数字档案与历史研究》,《中央史学》41号,2018年3月。

浅井良亮:《亚洲历史资料中心的研究利用》,《中央史学》41号,2018年3月。

亚洲历史资料中心协力室:《与亚洲历史资料中心的合作经过及现状》,《外交史料馆报》31号,2018年3月。

水泽光:《如何搜索档案》,《化学史研究》Vol.45,No.2,2018年6月。


[1] 关于中心的成立经过,请参考内海(2010)。关于近年来的情况,请参照波多野、大野(2016)及波多野(2018)等文。

[2] 构思21世纪恳谈会是以在战后70周年的2015年进行“回顾20世纪、研究21世纪应有的国际秩序的研讨”为目的,于安倍晋三内阁设立的。

[3] 请参考构思21世纪恳谈会(2015)。发言人为川岛真。川岛在中心成立10周年纪念会“亚洲历史资料中心10周年回顾与展望”中,也针对中心的亚洲历史资料提出“如何横向、纵向扩展”的问题[国立公文书馆亚洲历史资料中心(2012)]。

[4] 构思21世纪恳谈会的报告,可通过首相官邸官网(https://www.kantei.go.jp/jp/singi/21c_koso/)阅览。

[5] 中心咨询委员会是“根据中心理事长的要求,对于中心负责的业务进行调查审议,并提出必要建议”的机构。

[6] 关于外务省外交史料馆向中心提供的战后资料,请参考亚洲历史资料中心协力室(2018)。

[7] 签署协定的仪式是在琉球大学举行的,冲绳当地报纸对此进行了报道(《冲绳时报》2013年5月29日,《琉球新报》2013年5月31日)。

[8] “宫良殿内文库”(みやらどぅんちぶんこ)是冲绳县石垣市的公良家所继承下来的资料群,目前琉球大学附属图书馆藏有约300件。该资料群还包括从琉球王国时代到明治初期与清朝及美国的外交档案,以及明治初期煤矿开发、与冲绳本岛间的海运档案。

[9] 黑泽(2018)。前文所提论文也有很多。

[10] 数据核查委员会是为了“对中心构建数据库工作的结果进行核查审议,从而保证公布的数据库的正确性、客观性及信赖性”,由中心理事长召集的委员会。

[11] 例如「単行書·生蕃事件」(Ref.A04017197200)和「4月 テロング全権公使 長銃4挺等銃類被差贈蒔絵中箪笥差進」(Ref.C10071872100)等。

[12] 例如「3.明治三年対话书二米国之部二/1庚午(明治3年)6月3日」(Ref.B03030035500)和「1.明治四年対话书四米国之部一/1辛未〔明治4年〕2月7日」(Ref.B03030047800)等。

[13] 关于字典功能的完善,可以参考牟田、小林(2002)。

[14] 关于亚洲历史资料中心杂货铺,请参考大野(2017)及浅井(2018)。