青苹果、青苹果数据、青苹果数据中心、电子书制作、报刊数据加工、报刊数字化、

数字化生产工艺与技术

生产工艺是确保生产质量和生产效率的基础,青苹果生产工艺经过不断的革新和优化,已达到十分完善的境地。

1.数字生产工艺
  1)矢量造字工艺
  除应用超大字库补字外,公司针对缺字采用矢量造字工艺,字形美观,能适合不同计算机文件格式。
  2)青苹果“双编三校” 横纵查错法
青苹果“ 双编三校” 法用于校对修正文字错误,并可采用横向纵向交互查错,保证高标准的文字质量,对内用十万分之一误差率控制生产,对外用万分之一承诺质量。对于特殊稿件还可采用语料纠错技术等各种有效办法。
  3)版面细分定框识别技术
  对于特殊稿件采用单独行( 列)定框技术和单独文字定框技术,可提高20% 文字识别正确率。
  4)智能工艺
  智能还原数字版面:将版面图像进行智能分析,能自动识别100% 的版面结构,识别80% 的字体字号颜色信息,只有20%的部份需要人工操作。
  智能标引:直接从版面识别结果中获取标引内容,由于识别结果采用全信息XML数据存储方式, 75%的字段内容可直接从中提取,其余25%的字段内容通过智能辅助标引程序标引,可提高生产效率和数据质量。
  智能分类:地区、体裁、人物、报道对象4项类别做到智能自动分类。
  5)版面全信息重构技术
  对版面所有信息(包括版面结构和版面内容)全部数字化。在文字识别的基础上,对版面结构和版面内容的基元进行了智能提取,实现了数字化版面的智能化还原,以及文章区在版面缩略图中的准确定位和显示。把结构基元(包括字体坐标、字号坐标、行坐标、段落坐标等) 和内容基元(文字的内容、字体、字号、颜色等)全部信息内容封装在XML内,最后将XML作为基础数据保存,该数字化结果数据可重复和长期使用。
  6)PDF转换及压缩技术
  有多套系统进行PDF转换及压缩,可针对不同需求采用不同系统软件。

 

2.软件技术
  1)基于两种浏览器的全文检索数据库平台
  采用TRS检索引擎开发的全文检索数据库平台,市场占有率大,稳定性强;数据库结构开放;数据压缩功能强大,数据膨胀率小于0.5;采用分词索引技术,保证优质的查全率、查准率及响应速度。
  数据库平台支持局域网和互联网浏览和检索,同时使用IE(浏览文本)和Acrobat reader(浏览版面) 两种浏览器,一次输入检索词,同时实现报纸文本和报纸版面(PDF)检索结果的高亮显示。并具备在检索结果中渐进检索的功能,可与其他检索系统协同工作。
  数据库平台具有文章检索、版面检索、图片检索、广告检索、综合检索、专题检索、检索统计、生成专题子光盘、二次检索、同(反)义词检索、与或非表达式等数据检索功能。还具有数据分析、数据统计、创建数据库、创建数据库字段、建立频道导航、数据入库、数据维护、访问管理、信息发布等数据管理功能。
  以上全文检索数据库平台自1998年以来,已用于《人民日报》、《深圳特区报》、《天津日报》、《新华日报》、《中国日报》、《香港文汇报》等40余种报刊数据库,其中《人民日报》、《深圳特区报》、《广西日报》、《天津日报》、《中国日报》曾先后获得“王选新闻技术奖”(三次二等奖、一次一等奖)和“北京市电子出版物优秀奖”。该平台技术完全处于成熟阶段。
2)青苹果移动互联网和互联网电子图书阅读平台
  公司开发的电子图书阅读平台,适用于台式PC机和苹果机、各式笔记本电脑、平板电脑和手机(兼容安卓系统和苹果系统)。该阅读平台于2012年完成开发, 2013年2月投入使用。
该平台具备图书阅读、数据管理、数据导入和在线支付功能。
  3)采用分层隔离的安全访问控制架构技术
  数据库的安全体系采用对外访问服务通过前置代理服务器(FEP)隔离的方式。分成外部隔离层和内部隔离层,可以此阻断网络攻击和网络病毒,控制访问地址、账号,可输出访问流量报告等。前置代理服务器基于与后台数据库服务器不同的Unix/Linux 操作系统,多用户与多任务的特性,保证了系统对外提供稳定安全的访问服务。该技术已用于“华文报刊文献数据库”和《天津日报》数据库。
  4)现刊数字报自动转换对接历史报刊数据库技术
  这是一项实用技术,是报业和出版业的需求。青苹果设计开发的数据库入库及标引后台系统,将现刊数字报数据标引入库实现对接历史报刊数据库,确保数据的延续性和减少生产成本。
  5)自动生成专题、可移动数据库
  对数据库的检索结果筛选并打包生成专题资料集数据库,该数据库免安装,使用方便简单,可使用移动存储介质。
  6)数据加密技术
  使用硬件加密、软件加密、加密狗多种加密手段对PDF、XML 等格式文件进行加密。青苹果已经在20 余种产品上采用此类加密技术。

 

3.计算机软件著作权
  青苹果向国家版权局申请登记的计算机软件著作权有以下六项:
  1)版面流程管理系统
  软件全称:版面流程管理系统
  主要功能:统计、结算处理;报刊查验;特发零售管理。
  2)多功能报纸管理系统
  软件全称:多功能报纸管理系统
  主要功能:综合检索、浏览导航、图片检索、广告检索、检索统计、二次检索、扩展检索、与或非检索、检索结果排序。
  3)数据库加密系统
  软件全称:数据库加密系统
  主要功能:更高的安全性,特有的分组分级授权管理;完全开放的策略库,且功能强大的策略自定义功能,可以针对原文件为明文或密文时,分别进行控制。
  4)双重检索功能的报纸管理系统
  软件全称:双重检索功能的报纸管理系统
  主要功能:日期检索、标题检索、版次检索、版名检索、作者检索、专栏检索、正文检索、二次检索、扩展检索、与或非检索、检索结果排序。
  5)自动化语音检测系统
  软件全称:自动化语音检测系统
  主要功能:独特的识别服务器的反馈和非语音持续时间双重结束点判定功能,有效的改善了语音结束点的判定;减少识别器的数据处理量;能拒绝非语音的信号;复杂的应用环境下的信号流中分辨出语音信号和非语音信号,并确定语音信号的开始及结束。

 

分享到:
  • 企业邮箱   联系我们   人才招聘   网站地图  百度地图   湘ICP备14006570号    互联网出版权标志
  • 公司总部地址:湖南省长沙市开福区青竹湖大道409号观山悦写字楼
  • 联系电话:86-731-88231898 业务咨询:010-84656888 传真:86-731-88231897 E-mail:GA@egreenapple.com
  • 可信网站认证