
古籍数字化平台,它包括古籍OCR子系统、智能标点子系统、古文字处理子系统、元数据著录子系统、甲骨缀合子系统、版本鉴定子系统。
古代文献识别与转录系统、深度地图数字化科研平台、历代碑文转录与点校、历代墓志整理科研平台
文献人工智能识别系统:
1.古籍切图版芯检测模型 :对古籍有效文字区域智能检测,并智能标注有效区域框,生成区域框坐标信息,古籍的版面漏检率不超过1%,处理分析每张图像速度控制在1秒内。
2. 古籍单字检测模型:对古籍文字智能检测,并智能标注文字框,生成区域框坐标信息,单字漏检率不超过1%,噪点辨识率不低于99.9%,处理分析每张图像速度控制在1秒内,
3.古籍单字识别模型:对古籍文字智能识别,生成识别置信度值,提供5个最高置信度字符值,古籍刊刻本的识别准确率不低于98%,古籍工整抄本识别准确率不低于90%,处理分析每张图像速度控制在1秒内,
4.报纸单字检测模型 :对报纸文字智能检测,并智能标注文字框,生成区域框坐标信息,单字漏检率不超过5%,噪点辨识率不低干99.9%,处理分析每版图像速度控制在10秒内,
5.报纸单字识别模型:对报纸文字智能识别,生成识别置信度值,提供5个最高置信度字符值,识别准确率不低于95%,处理分析每版图像速度控制在20秒内,
6.古籍识别训练模型:基于机器深度学习的训练样本,提高不同版本古籍文献的识别准确率,古籍训练模型不少于200万份古籍训练样本集,单字训练样本集1万种以上,每种样本量不低于50个图片字符集。
7.报纸识别训练模型:基于机器深度学习的训练样本,提高不同版面报纸文献的识别准确率,报纸训练模型不少于1万份报纸训练样本集,单字训练样本集1万种以上,每种样本量不低于100个图片字符集。
8.识别任务管理系统:多线程识别管理,智能排序识别优先等级,监测识别任务,识别消息队列监测识别结果返回上传者,
指标:参数识别线程干扰值为0,监测识别结果消息返回时间1秒以内。


