自标准数据 Q & A

10月份以来,有关自标准数据的讨论越来越多,各位专家、学者都表达了自己的意见和建议。在此一并致谢!
大家在讨论迸发出了很多闪光的东西,对于我们正在面对的问题有很大的参考和指导价值。希望继续讨论。
今天,我将一些疑问和我的个人观点集中整理一下。以后会持续更新整理,并与大家共享,向大家请教,还请继续批评指导。

10月份以来,有关自标准数据的讨论越来越多,各位专家、学者都表达了自己的意见和建议。在此一并致谢!
大家在讨论迸发出了很多闪光的东西,对于我们正在面对的问题有很大的参考和指导价值。希望继续讨论。
今天,我将一些疑问和我的个人观点集中整理一下。以后会持续更新整理,并与大家共享,向大家请教,还请继续批评指导。
再次感谢!

Q1: 为什么叫“自标准数据”,它是标准么?
A:主要基于三个考虑吧。一是“自描述”等术语已经被使用,为了避免混淆。二是“自格式”、“自定义”等有些随意。虽然是数据提供者自己定义的标准,但毕竟仍是标准,不应该随意变动。否则将出现共享障碍。“自标准”也可以叫做“自定义标准”、“自治标准”、“局部标准”,等等,其实叫什么都无所谓,简单明了就好。三是还是自认为仍然是标准,只是有所突破和侧重吧。“标准”这个字眼是不是显得更正经一点呢? 别没事就换套衣服!稳重点行不?

Q2:自标准数据与元数据、数据元的区别?
A:其实自标准数据大致上相当于“数据元+元数据”,但还是有很大的不同。首先,数据元和元数据的设计、存储、操作都有比较严格的规范,一般都是基于数据库或数据仓库的,特别是结构化数据。其次,数据元一般是不可分割的最小数据单元,而自标准数据在体量或规模上是多变的、不固定的,可以很大,也可以很小,甚至小到数据元的水平。比如自标准数据可大到一个地震工区的数据体,也可以小到只有一个井号的数据。第三,元数据和数据元一般存在于一个庞大的数据库或数据仓库实体中,一般不会同时传输。但自标准数据中数据与标准一般是在一起,就像电器与使用说明书。当然当你完全掌握了使用方法,你当然可以扔掉说明书, 但那只是你自己的事,别人再用可能还得用说明书。所以说明书是标配,得跟电器在一起。
这个问题请大家多与东北石大袁满教授探讨,他在这方面造诣很深,我从他那里得到了很多指导和帮助。虽然他不同意“自标准数据”的提法,但他仍同意我的解决问题的思路。他也为大庆数字油田建设做出了很多贡献。

Q3: 为什么不用webservice或adapter?
A:我就用我当前正在面临的困境来回答吧。我们正在做一个系统,叫做《大庆油田生产经营管理与辅助决策系统》,简称 DQMDS。系统名字体现不出来建设内容。实际上我们是要建立以驾驶舱为主要功能的集成系统,要把已有业务系统的数据抽取出来,放到一块,展现出来,并一定程度地进一步钻取数据和操作。
我们现在有两个难题:
第一个,美女只许看不许摸! 初步调研显示,我们大概要集成近百个系统,最难办的是美丽的封闭系统。这些封闭系统一般都是掌管着人财物等关键资源的强势系统,还有最美的ERP美女。这些系统一般都是买来的,很多还是基于国外的大平台开发的,我们没有开发权限,不许我们摸。可是他们不给你接口,想建立美女热线?美得你!让服务商专门给你开发webservice之类的接口是很麻烦的,钱也花不起,时间也等不起,维护也耗不起。一般能提供数据就算很幸运了,而且你也别想人家遵守你的标准。所以只能把人家的数据导进来。
第二个,跟美女太亲密累得慌! 我们的系统要从近百个系统里拿数据,如果都是webservice链接,一个系统不好使,我们就转不起来了。还是松点好,自如一些。Webservice是紧耦合链接,实时连接,累人。自标准是松耦合,想起来就链接一下,不强迫,自己轻松,美女更轻松,连不上也死不了,可以用老数据啊,回忆也是很甜蜜的么。嗯,有点像TCP协议和UDP协议的区别!网络的链接和无链接。
但是,自标准数据不排斥webservice、adapter等技术,完全可以兼用。自标准数据的出发点是无奈之举,但现在看来这也挺舒服的。

Q4: 数据中心的主数据库用自标准数据合适么?
A:不合适!数据中心是严格组织的数据,务必标准规范。自标准数据主要解决数据中心之外的数据交换问题,面向广大的人民群众,不是在洁净明亮的大玻璃房子里,而是可能在满身泥水的油田作业现场。所以还是简则易从。谁不让老百姓舒服,谁就别想舒服,领导不行!专家不行!帅哥不行!美女???行。。。。。。。行么?。。。。。时间长了也不行!

Q5:自标准数据跟信息资源规划有关系么?
A:有!都是为了把数据或信息理顺,但信息资源规划侧重于一个系统内部,而自标准数据侧重系统间。一个是竖着的,一个是横着的,T型。这是张艳国老师的说法,我很同意。关于这个,请多和高复先老师探讨吧,也可以和张艳国老师、胡德平先生、黄放明老师讨论,他们都是黄老师的嫡传弟子,我自命是高老师的学生,呵呵,全靠一张厚脸皮,净给高老师丢面子了。
在这里向高复先老师致敬!

Q6:自标准数据怎么考虑数据的冗余、唯一、统一、准确?
A:考虑的不多。主要考虑数据集成的现实性:让集成的系统运行起来,不被被集成的系统缠绕死,或拖死。所以松耦合是关键,那就得放弃一些严格的条件了,这是一种平衡吧。
不过,弱弱的问问:
 冗余都是坏处么?数据中心里不冗余就行了吧?
 唯一就没选择了。虽说选择有时是痛苦的,可是不同的数据之间相互还是有参考意义的吧?
 统一就一定好么?按照系统论观点,同质无差别的统一的系统没有生命力。差异是创新的原动力。
 非得那么准么?我算个周长得把圆周率精确到多少位才行呢?差不多就行吧?
 我们的家有必要总是整整齐齐,不敢下脚的么?非得符合几个范式?轻松点不好么?太干净的太太是不有点烦人?动不动就不让上床。同意的举手!

 

(随时继续添加更新)
2013-12-6

原创文章,作者:智慧城市网,如若转载,请注明出处:https://www.zhihuichengshi.cn/xinwenzixun/13327.html