无标准是解决数据标准冲突最好的办法(一)

无标准是解决数据标准冲突最好的办法(一)

高志亮

(长安大学数字油田研究所)

作者按:王权主任写了《自标准数据》后,袁满老师说他写个“月子”,然后在论坛上发表了《数据标准是企业信息化与实现信息有效集成的生命线》的大作。我对数据研究的很不够,一直在研读两位专家的大作,今天是“1314”的跨界,我就写个“年”吧(年,相传是怪兽,我的年是体会,最好不要成为奇谈怪论),嘿嘿,供大家批判。高志亮(2014.1.1)

 

数据标准,是一个很重要的问题,数字油田多少年来,就没有得到彻底的解决,近来在智能数字油田论坛中一直在讨论数据标准问题,我学到了很多的东西。因此,我利用这个话题,想谈谈我自己的一点看法。

1、关于标准(模型)

王权主任是我国数字油田领域的一面旗帜,早在数字油田被提出之时,就编制了数字油田的基本模型,他的这个模型影响了整个数字油田的建设,直到今天,如图1:

1

 

图1  数字油田建设模型(大庆油田)

在这里我顺便说点模型的概念。在信息化建设以来,“模型”大泛滥,“各种解决方案”大泛滥,什么都叫模型。其实,模型是具有严格寓意的。通常叫“模子”、“模具”,如生产和科学实验时所使用的模型。最简单的理解就是我们要做月饼,只要有一个月饼的模子,放入食材,就可以做出无数个一模一样的月饼来。

模型,即规范。在我国《辞源》中这样记载:“模,法也。”清段语载注:“以木曰模,以金曰镕,以土曰型,以竹曰范,皆法也。”模型,还有“模范,楷式”,即模楷。三国志魏管宁傅附胡昭记:“初,昭善史书,…….,动见楷模焉。“即法式,榜样。可见,模型是定型了的模具或规范,严格地讲在一件事物上只有一个模型,然后利用这个模型可以批量地生产同类型的产品,就是照着那个“榜样”来做。其实,这就是一个标准。

这说明,模型就是一个参照物,一个基本的规范。在某种程度也就是一个标准。

在数字油田建设和数据建设上,我们可以认为大庆油田2000年提出的数字油田模型,就是我国第一代数字油田建设的模型,也是一个最基本的规范、标准。之后我们出现了很多的框架图、解决方案等等,都是这一模型的异化和演化的产物。

当然,数字油田自提出以来一直建设到现在,人们对数字油田的愿望就是实施数字油田数据数字化建设与管理后,让科研人员彻底摆脱“80%的时间用于寻找数据,20%的时间研究”的困境,转变为“20%的时间用于寻找数据,80%的时间作研究”,并消除“数据的灾难”。结果数字油田建设使油田数据全部完成了数字化,确实取得了很大的成就,但是,“20%的时间用于寻找数据,80%的时间科学研究”没有达到,反而数字化的数据越来越多,造成了“数据更大的灾难”。这是为什么呢?我认为:

1)我们的数字油田数据建设没有顶层设计。大庆油田的数字油田建设模型,是一种概念性的设计,对于数据建设起到了很大的引领作用,同时规范了数据建设的思想。但是,对于我国油田数据建设,在数据标准,数据关联整理、数据融合、数据在内部的流转并没有涉及或作更好的约定。说明如果将这个模型做顶层设计,还不够。

2)我国数字油田在数字地球,智慧地球、云计算、物联网大量的先进理念和新名词的引领下,人们对数字油田有了更远的思考,超前发展了数字油田的数据建设。但是同时,这些新的名词对数字油田建设又有很大的冲击,人们的思维超越了计算机技术或者说信息技术基础的限制,人们在新理念和传统技术模式下,追求类似于“数据、信息、业务”的“三流合一”,大力倡导消除数据的“鸿沟”和信息的“孤岛”,却并没有关注数据的内在流转和外在的规范建设,出现了更多、更大的“鸿沟”和“孤岛”。

3)开发出很多独立、封闭的油田管理信息系统,数字油田数据建设的结果是:只见森林,不见参天大树。在我们数字油田建设中很多油田研发的MIS可以达到200个,这是前所未有的成就,同时也是前所未有的灾难。一个个信息管理系统犹如一棵棵独立的“杨树”,成为无数个封闭的、独立的MIS,耸立在数据“模型”之上,造成了更大的数据灾难。

21221

 

图2  只见森林 不见大“树”

图2寓意每一棵树就是一个独立的MIS应用系统。这就是我们当前数字油田数据的现状。不见树,就是一个数字油田完整的、独立之树。

这就造就了数字油田的“标准冲突”和“数据独立”的现状。让数字油田数据走入困境。

2、关于自标准数据

王权主任是一个富有创造性思维的大家,他在完成数字油田的模型建设之后,这么多年来一直在思考,又提出了“自标准数据”的概念。

自标准数据”产生的基本原因,按照王权主任生动的描述,我们的一个个MIS都是一个个的“美女”,“碰不得”。“我就用我当前正在面临的困境来回答吧。我们正在做一个系统,叫做《大庆油田生产经营管理与辅助决策系统》,简称 DQMDS。系统名字体现不出来建设内容。实际上我们是要建立以驾驶舱为主要功能的集成系统,要把已有业务系统的数据抽取出来,放到一块,展现出来,并一定程度地进一步钻取数据和操作。”(王权)

因此,王权主任再一次标新立异,创造性地提出“自标准数据”。并给出了定义和模型。

“自标准数据,Self-Standard Data,即自带标准或格式的数据体。数据提供者按照自己的标准或格式提供数据,并将该数据所使用的标准或格式与所提供的数据一起打包,数据使用者按照该标准或格式自行解读并使用数据。它是传统数据标准体系的重要补充和突破。”

其模型,如图3:23422w

 

图3 自标准数据模型

对于王权主任提出的自标准数据概念,我仍然还需要再学习、再认识。作为学术问题和多年的老朋友,我对此有这样的几个评价:

1)大庆油田是我国油田企业出经验、出成果的地方,他们不仅在数字油田,在油田研究与开发技术、油气生产等都是。之所以他们有经验、有成绩,就在于他们敢于创新,勇于创新。“自标准数据”就是一个创新和创造。

2)一项创新技术,是好,还是不好,“实践是检验真理的唯一标准”,即只要好用、适用,就是个好东西。据王权主任介绍“用起来挺舒服的”,那就符合“好用、适用”的原则,证明是个好东西。我支持。

3)自标准数据如果能在《大庆油田生产经营管理与辅助决策系统》解决了当前数字油田数据建设中“标准冲突”,“数据阻隔”,“美女不能碰”的问题,就有很好的实用价值,希望这个研究能继续坚持下去,即使还有更好的方法来解决问题,这也是我们数字油田数据建设中一个很有价值的探索。

但是,实事求是地讲,我还是有几个不理解,需要和王权主任学习、探讨:

1)我不理解“自标准数据”这个名字,是“标准”,还是“数据”,有点模糊。按照王权主任的介绍和定义,是数据捆绑着标准,那就是“数据自带标准”。这个好像不是标准问题。我同意袁满教授的意见,我们可以创造性地叫一个更加贴切的名字。

2)我不理解“自标准数据模型”(见图3)。数据海洋,可以理解为大数据,也可以理解为无数个MIS和各类数据库。但是,在数据的海洋中设立数据码头,这两个数据码头分设在海洋的两岸,由一个数据通道连接,在这个数据的通道的中间设立数据泵(类似于适配器),数据的通道尽头是应用。其中这个数据泵设立的很奇怪,为什么放在数据通道的中间?它的作用和地位是什么?

3)进港和出港都有自标准数据,奇怪的是数据海洋两岸都有进港和出港,都有数据码头,都有自标准数据,一个通道,他们的逻辑关系是什么?严格意义上应该是数据海洋提供数据和标准,到数据码头,是数据进港,数据海洋完成了自己的任务。数据码头要将数据进行整理,建立码头“临时仓位”管理,自标准发挥作用。数据在数据码头开始出港时,数据泵需要做适配,到某一个应用系统中,它不是全部的应用系统,然后出港。

作为泵,是需要一定的动力,这个动力来自哪里?不知道,如果没有力,那么这个泵,就是适配器,就可以了,叫个泵,反而不知它做什么。

这三个不理解,我想和王权主任请教。但是,总的来说,有一个原则,就是:好用,就是个好东西,不管它叫什么。

 

相关文章:

无标准是解决数据标准冲突最好的办法(一)

无标准是解决数据标准冲突最好的办法(二)

无标准是解决数据标准冲突最好的办法(三)

原创文章,作者:智慧城市网,如若转载,请注明出处:https://www.zhihuichengshi.cn/xinwenzixun/13859.html