中国高新技术企业官方 国内统一刊号:CN 11-4406/N
国际标准刊号:ISSN 1009-2374
* 投稿网站
中国高新技术企业
《 中国高新技术企业 》
级别:国家级     分类:科技    周期:旬刊
主管单位:国家统计局
主办单位:中国统计出版社
国内刊号:CN 11-4406/N
国际刊号:ISSN 1009-2374
收稿编辑:QQ /电话2880067970 / 0531-85701017
投稿邮箱:zggxjsqy@163.com
期刊名称 (*)投稿期刊名称
文章标题 (*)投稿论文的题目
作者姓名 (*)只需填写通讯作者
作者电话 (*)方便编辑及时沟通
作者邮箱 (*)方便编辑做详细用稿答复
上传稿件 (*)限word文件
投稿附言   
期刊信息
期刊名称:中国高新技术企业
主      编:徐辉
出版周期:旬刊
出版地区:北京市
定      价:20.00元
收      录:知网、万方、维普、龙源
社      址:北京市西城区月坛南街75号国家统计局西办公楼708室
邮政编码:100070
范文-基于科研大数据的辅助审核系统建设探讨-中国高新技术企业

 基于科研大数据的辅助审核系统建设探讨

陈月英1  穆仕华2
(1贵州省信息技术创新服务中心 贵州 贵阳 550002; 2贵州省科技信息中心 贵州 贵阳 550002)
摘要: 科研大数据对国民经济和社会的发展具有重点的战略地位,是政府进行战略研究和决策的重要依据。科研数据具有数据容量大、种类繁多、审核困难的特点,科研数据的审核工作量大,数据审核的效率、质量和可用性难以保障。本文探讨了科研大数据辅助审核的机制、辅助审核方法和管理制度,为建设科研大数据辅助系统奠定了基础。
 
关键词: 大数据、数据审核机制、辅助审核方法
 
0   引言
大数据具有数量巨大、结构复杂、类型众多的特点[1],大数据是促进现代经济社会发展的关键因素,具有重要的战略地位[2],科研大数据由科技统计、科技成果、科技报告等数据库组成。科技统计是科研决策的重要依据,正确利用统计资料能保证科研决策的科学性[3];科技成果转化是科学技术与经济、社会更好融合的重要桥梁,是科技创新成果与社会经济活动的有力结合点[4],科技报告是科研过程管理的有效手段,也是国家重要的基础性战略资源[5]。科研大数据分散在各种管理信息系统中,主要存在身份管理困难、数据校核困难、缺乏校核管理三个问题。
(1)身份管理困难
科研大数据涉及多种类型的管理信息系统,由于不同系统的建设背景和目的存在较大差异,因此有各自的用户管理系统。随着时间的推移,管理信息系统的数量和类型越来越多,通过管理信息系统注册的用户账号也越来越多,信息系统的管理者无法确保用户身份的真实性和唯一性。此外,科研机构和个人在不同管理信息系统中都注册有账号,经常存在忘记账号和密码的情况,加大了信息系统的业务咨询和技术支持工作量。
(2)数据校核困难
科研大数据涉及科技项目、科技成果、科学仪器、科技文献等多种类型的数据,数据量大,业务流程复杂,在科技管理部门人员数量有限的情况下,数据校核的工作量大,审核人员只能从形式上对数据进行审核,难以甄别科研机构和个人信息的的真实性和有效性,科研人员的学历、职称、取得的科技成果等信息的真伪无法鉴别,导致数据审核的效率低,导致部分无效数据的出现,甚至出现用户身份和用户材料造假的事件,在一定程度上造成国家科研经费的浪费。
(3)缺乏校核管理
科技管理部门的人员在校核科研数据时,在业务咨询、数据审核、数据发布方面缺乏明确的分工,往往一人身兼数职,疲于应付。在业务咨询方面,主要以固定电话的方式为用户提供咨询服务,由于缺乏专业的话务中心,科研机构和人员往往在业务繁忙的时候无法接通科技管理部门的电话,导致科技咨询服务质量的下降。在数据审核方面,缺乏有效的辅助措施,导致数据审核的效率低下,未能通过多种渠道公开数据核审的结果。对于审核过程中发现的问题数据,缺乏有效的监督机制和处理措施。
1   统一用户身份认证 
为了解决科研大数据的用户身份分散、不统一的问题,有必要建立统一的用户身份认证机制,使科研机构和个人能够通过统一的用户名和密码实现不同系统的登录,便于登录信息的管理。身份认证的方式种类繁多,有必要对常见的身份认证方式进行探讨,以寻求一种合适的统一身份认证方式。
(1)常见的身份认证方法
常见的身份认证方式可分为用户自主设置账号和系统自动分配账号两种。当由用户自主设置账号时,系统提供一套账号设置规则,如以字母、数字和特殊符号相组合的方式设置账号和密码,并将账号和密码的长度限制为6至20位,或者要求提供一个QQ或邮箱账号作为系统的登录账号,并按规则设置密码;当由系统自动分配账号时,系统按一定规则随机生成用户名和密码。这两种方式的优点是用户具有命名账号的自主权,缺点是用户在不同系统设置的账号和密码可能不一样,当忘记用户名或密码时,不便于找回。
(2)统一的身份认证方法
随着应用系统越来越趋于多样化和复杂化,用户对服务质量的要求也越来越高,统一身份认证已成为各系统必不可少的一部分[6]。统一身份认证的有效方法是要求科研机构以组织机构代码证作为其用户名,而对于个人用户要求其采用个人身份证、护照等有效证件的编号作为其用户名,这样就可以确保用户身份的唯一性。与此同时,将个人手机号与登录账号绑定,在忘记密码时可发达特定指令找回密码,这样既方便和科研机构和个人,又减轻了科技管理部门不必要的咨询服务工作。
2建立数据审核机制
科研大数据的审核对象可分为身份信息校核、档案信息校核和业务数据校核三种,数据审核的目标是确保数据的真实性、正确性和完整性。因此,有必要建立完善的数据审核机制,以确保采用辅助审核方法提高数据审核的效率、质量和可用性。
数据审核机制的建立包括两方面的内容,一是建立特征审核规则,二是建立数据审核规则。数据校验规则的作用是对用户身份相关的信息进行合法性检查,如身份证、组织机构代码证、电子邮箱、联系电话、邮编等,必须是符合对象的特征格式,即形式上合理;数据审核规则的作用是对用户录入的数据按照业务规则进行审核,即实质上合法。特征审核机制通过各种正则表达式在客户端进行验证,数据审核规则将用户输入的数据与设定的业务规则在服务器端进行比较,通过比较的结果确定数据的正确性和有效性。
3 辅助审核方法
在按照审核机制对系统进行设计的同时,还需引入数据辅助审核方法,以确保科研数据涉及的身份信息、档案信息和业务数据的真实性。系统对用户提交的数据进行实时、动态审核,以报表、图表等方式对汇总的结果进行展示,对于不符合要求的数据,科研管理人员可通过系统功能向填写数据的用户发送手机短信、电子邮件等,以告知其数据审核失败的原因,并要求给予修正,直到符合要求。在此基础,科研管理机构的管理人员对系统自动审核通过的数据再次进行形式审核,以最终确定数据的有效性。
(1)身份信息审核
对于科研机构的信息,应与工商和税务系统进行数据交换。工商系统登记了科研机构的注册信息、年检信息和经营情况,通过组织机构代码证匹配可以获取到机构是否在规定的时间完成了年检,盈亏情况等,结合税务系统还要获取机构的纳税情况。对于个人身份信息,应与公安系统进行数据交换,以确保个人身份证、护照等信息的真实性和有效性。
(2)档案信息审核
个人信息还涉及学历、职称、承担的项目、取得的成果等信息。个人学历的审核可与国家学籍管理系统进行联网审核,个人职称信息可以人事管理系统进行联网审核,个人承担的项目可与国家和地区科技管理部门的项目管理系统进行联网审核,个人发表的论文、获得的专利等可与科技文献系统进行联网审核,科技成果可与国家科技成果库和地方科技成果库进行联网审核。
(3)业务数据审核
业务数据分为结构化数据和非结构化数据。对于所属学科、职称、学历等结构化数据,可在系统中设置为菜单的方式供用户选择,以确保数据的一致性;对于涉及经费等数值的数据,应通过规则限制数据的边界,在超出规定范围时给予提示;对于非结构化数据,应通过字数计算、关键词检索、内容比对等技术确保数据内容的有效性和合理性。
4 相关技术
(1)数据交换技术
在实现身份审核、档案审核和业务数据审核时,需要和工商、税务、公安、科研管理机构等部部门的业务系统实现数据交换,各部门采用的技术架构、操作系统和数据库可能存在较大的差异,为了解决差异,实现数据的交换和共享,可采用WebService技术实现不同系统之间的数据交换。
(2)数据挖掘技术
为了防止科研项目、科技成果等科研数据的重复申报,需建立数据仓库,对垃圾数据进行清理,对有效数据进行挖掘、分析,找出相似度超过规定指标的项目,以便于采取有效的措施进行管理。
(3)网络安全技术
在数据审核的过程中,由于涉及到分布式系统之间的数据交换,因此需要考虑数据加密传输问题。数据加密传输可采用SSL、数据证书等安全描述确保数据传递的安全性。
(4)移动APP技术
为了提高数据审核的即时性,在移动互联网技术已经成熟的情况下,可开发运行于移动终端设备的APP软件,以方便科研机构的管理人员对科研数据的审核进行掌控。
5 创新管理制度
尽管采用数据审核机制和数据辅助审核方法提高了数据审核的正确性、可用性和效率,但仍可能存在学术造假的情况,这就需要由政府主导,借助中介服务机构的力量对项目、成果等科研数据进行项目查重、专利检索和科技查新,并组织专家进行审查,将审查的结果作为科研机构和个人信用评级的依据,并将评级的结果应用于科研管理的各个环节中,以促进科研氛围的良好发展,使科研数据真正应用于国民经济的发展和国家战略的制定中。
6 结束语
科研项目评审是科技管理工作中极其重要的环节,科研项目的在线评审体系是确保科研项目以信息化手段评审的重要基石。只有按科研项目在线评审体系对评审系统、电子监察系统、信用评价系统进行设计,才能确保项目数据库和专家数据库的完整,才能引入用于查证科研项目佐证材料的第三方数据库,才能确保科研项目在线评审的流程规范、在线评审的过程公平公正,才能提高评审结果的可用性和可信度。
参考文献:
[1] 郭丽娟.大数据的特点及未来发展趋势[J].信息通信,2014,(第10期).
[2] 王伟玲.大数据产业的战略价值研究与思考[J].技术经济与管理研究,2015,(第1期).
[3] 章虹.浅议统计在科研决策中的应用[J].财经界(学术版),2014,(第20期).
[4] 秦蒙.科技成果转化研究综述[J].天津科技,2014,(第8期).
[5] 范文,赵今明.中国科技报告体系建设研究[J].安徽科技,2014,(第1期).
[6] 苏星晔,徐方南.统一身份认证技术研究[J].中国新通信,2015,(第2期).