注册

揭秘现实版“大案牍术” 档案数字化背后的精细活


来源:现代快报

“大案牍术”是什么?这个词,就连文史专家也觉得陌生。电视剧《长安十二时辰》的热播,带火了它。剧中解释,相当于现代的大数据。靖安司中,徐宾最擅长在档案中发掘有用信息。

编页码

修裱

著录 现代快报+/ZAKER南京见习记者顾闻摄

“大案牍术”是什么?这个词,就连文史专家也觉得陌生。电视剧《长安十二时辰》的热播,带火了它。剧中解释,相当于现代的大数据。靖安司中,徐宾最擅长在档案中发掘有用信息。

唐朝对档案的利用,真的这么发达吗?不知道。不过,进入档案数字化时代的今天,“大案牍术”真的可以实现。近日,现代快报记者探访江苏省档案馆,揭秘现实版“大案牍术”。

查档大厅,人人可以操作“大案牍术”

“我们在《长安十二时辰》里看到的所谓的‘大案牍术’,实际上是作者的艺术创作,是一种虚构。”江苏省档案馆管理部主任蔡宜军告诉现代快报记者,剧中,在很短时间内,利用档案能查到很多东西,并且很快得出结论。这在当时的条件下,几乎是不可能实现的。

“大案牍术”依赖的是人脑的记忆,每次都要临时调度大量人力和物力,突击整理和分析档案。“而如今有了现代化的工具,利用计算机,我们可以把人力、物力的投入放在平时。当需要查询时候,就很便捷了。”

8月9日下午,在江苏省档案馆,不少人正用查档大厅的电脑查询想找的档案。

“带上身份证,便可以查阅开放档案。”一位工作人员介绍,身份证验证后,便可以获得一个授权码,然后在查档区的电脑上登录系统,根据题名、年份、责任者、机构等进行检索。检索到想要的内容,提交申请,获得审批之后,便可以看到全文了。

数字化的背后环环相扣,都是精细活

现在,在档案馆的查档大厅检索、利用档案,已经非常便捷了。其实,这背后有一系列的“精细活”。记者探访江苏省数字档案中心,见证了纸质档案数字化的幕后全流程。从档案出库、拆卷、编页码等前期处理,到修裱、扫描、著录和数据挂接,再到档案装订、入库……环环相扣,并且每个环节有质量检查。

首先是拆卷,进行初步鉴定和简单筛选,看看里面有没有破损的地方、重复的内容,然后进行编页码。“不是每一卷都是非常完整的,有的卷打开以后破损很严重,拆的时候就要很小心。参差不齐、大小不一、黑白不均,有被老鼠咬过的,有水淹过的、有火烧过的……”江苏省数字档案中心副主任刘兢兢介绍,历史档案的纸张会有破损、皱褶、折痕,拆卷之后,要先压平,需要修裱的要拿去修,全部都处理好了,才能进行扫描。

著录是最重要的环节,与档案的检索、查阅直接相关。90后李乐宁是著录组组长,记者采访时,她正聚精会神地对着电脑屏幕,在密密麻麻的表格中依次输入档号、文件号、责任者、题名、文种等信息。长时间盯着电子表格,不会眼花吗?李乐宁说,工作六七年,也不是没出过差错,但总体上已经练得很娴熟了。“在著录项里,要把档案的信息提取出来。比如简报,如果只把简报两个字录入在档案的题名里,那么就没有检索的意义了,因此需要提取出:什么时间、什么内容的简报。”刘兢兢介绍。而档案的文本并不统一,有繁体的、文言的,甚至还有别字、文法不规范的,自动识别难以完成,就必须人工著录。

著录完成之后,是数据上传、挂接,完成目录与扫描图片的关联。最后,普通的档案要经过装订,线装书还要恢复原貌,大小不等的便条要整齐地贴在里面,档案才能入库保存。

“文字、声像、录音、图片,各种载体的档案都要数字化。现在大批量的是纸质档案的数字化,便于跨馆、跨区域、跨时空地利用。”

珍贵原件在库房妥善保存,颐养天年

档案数字化以后,珍贵的原件便可以回到库房“颐养天年”了。档案库房,对于温湿度都是有规定的,要求温度控制在14~24℃,相对湿度控制在45~60%,稳定的环境,能使档案得到妥善的保存。

江苏省档案馆的特藏库,是“镇馆之宝”的集中之地。馆藏珍贵档案,都保存在这个库房:有中国档案文献遗产《朋僚函札》《南京长江大桥建设档案》以及重点革命历史档案;有唐代以来的书画精品、明代诰命和清代翁同龢的题跋;还有3万多盒录像带、12万张照片、5000多枚印章等特殊载体档案……

其中,录像带保存了上世纪八九十年代江苏电视台播放的所有新闻类、专题类、文艺类等节目。老照片已经全部数字化了,属于公开档案的部分照片,在一楼查档大厅都能查阅到。还有唱片档案,是上世纪20年代至60年代的黑胶唱片,包括当时上海知名歌手周璇、京剧名家的唱片等等,这些现在基本上也数字化了,但目前还没有上网公开。

“这些全部要数字化,分期分批公开。”江苏省档案馆法规宣教处处长张少敏说。

档案将更有“智慧”,实现全文检索

江苏省档案馆有一个区域,整齐排列着一排排大约一人高的柜子,柜子由一格格抽屉组成,抽屉里装满了小卡片。蔡宜军介绍,这些是最初的纸质档案检索工具。在档案数字化之前,它们在早期的“大案牍术”中扮演着重要角色。

经过一段时间的发展和演变,现在,江苏省档案馆正在进行档案的全文数字化,也就是把原来的档案变成计算机可以识别的图片格式文件,通过题名、责任者等著录项中的关键词进行检索。

“下一步,是把档案转化成可以进行全文搜索的数据格式。加上现在各行各业形成的电子文档,这些都是可以进行全文数据检索的。”蔡宜军说,以此为基础,才能实现档案的“大数据”管理、检索和应用。

国家档案局原局长、中央档案馆原馆长杨冬权也曾提出:“档案数字化,是把纸质档案扫描成图片,这些图片上的档案内容,还需要人来解读,不能成为数据,由电脑来处理。今后,应该把这些图片转化为电脑可以读的字,变成电脑可以任意检索的数据,进入大数据系统,可以任意检索、主动推送、深度挖掘。”这也就是“智慧档案”,比现在的档案数字化更高级。因为档案数字化需要对扫描的档案进行文字识别、注录标题并输入电脑,工作量巨大,难度也很大。今后全文内容识别的OCR技术更先进,是档案人的下一个目标方向和风口。

[责任编辑:潘文茜]

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考

今日推荐

凤凰新闻 天天有料
分享到: