数据的三个基本特征 数据是什么意思

我们都说今天是数据的时代,到处都在讨论大数据,每个人都在说自百思特网己在研究数据,那么到底什么是数据呢?我们能不能给数据一个最简单而朴素的定义呢?这个问题看似简单,其实不是那么容易 。
这里跟大家分享一个小小的玩笑:很多朋友说北京大学的保安都非常深刻 。为什么?因为来北京大学访问参观的时候,常常被拦住,然后会被问三个问题:第一,你是谁?第二,你从哪里来的?第三,你要到哪里去?这三个问题都看似简单,其实深刻 。凡夫俗子,像你我这样的,恐怕回答不了 。能回答这三个问题的,那是圣人 。这是一个小小的玩笑 。从这里我们可以看到,看似简单的问题不见得真的简单,甚至有可能深刻 。同样的,什么是数据呢?这个看似简单的问题却不容易回答 。我们可以尝试用这个问题问很多很多的从业者,我相信,我们会收到很多很多不同的答案 。
——我常常听到的答案,最典型的有两个 。第一种回答说:“数据就是信息 。”这么说对吗?我没有反对意见 。但是这个定义有一个缺点,这个缺点就是,信息太抽象了 。数据本身就是比较抽象的概念,信息似乎是一个更加抽象的概念 。数据和信息两个都是非常抽象的概念之间互相定义,这并不令我满意 。那么,能不能给数据一个更加简单而落地的定义呢?有朋友说:“好啊,王老师我给你一个非常落地的定义:数据就是数字呗 。”这么说对吗?这么说也有一定的道理,因为数字大概是最典型的一种传统百思特网数据 。我们看到的很多的数字,例如:GDP、股市的指数、人的身高、体重、血压啊,统统都是数字,当然也都是数据 。所以说数字就是数据,这肯定没有问题 。但是反过来,数据就是数字吗?这可就不一定了 。
那有人说:“王老师,我们的定义你都不满意,那你的定义是什么呢?”我认为,凡是可以记录的,都是数据 。这里百思特网的关键词是“记-录” 。如果按照这个定义来看,首先,数据的范畴大了很多,远远不局限于数字这一类了;另外,更重要的一点,既然涉及到记录,那么我们就要谈谈记录数据的技术手段 。因为不同的技术手段,可以提供的记录是不一样的 。
例如,手机可能是一种记录手段,相机是一种记录手段,数据库是一种记录手段,我的传统的纸笔墨又是另外一种记录手段 。既然涉及到技术手段,那么它就会有时代特征 。为什么?因为不同时代提供的技术手段是不一样的 。所以,在我的定义背后,隐含着一个可能更加深刻的道理,就是“数据的定义有强烈的时代特征 。”
下面跟大家分享两个例子:
第一个例子:请问声音是数据吗?我想大家不会有任何人反对声音是一种重要的数据 。但是在一百年前,我认为声音不是数据 。为什么?因为我们没有任何办法能把它存储下来,既然都没有办法存储下来、记录下来,那更谈不上分析,怎么说它是数据呢?但是今天,我们的音频设备可以采集你的声音,然后转化为音频数字信号,然后可以支撑很多有趣的应用 。哪些应用?例如:iPhone的Siri、搜狗的语音输入法、的语音翻译,等等很多很多 。由此可见,声音是一种数据,而且是一种具有强烈时代特征的数据 。它在一百年前,不是数据,但是由于技术的进步,现在是了 。随之而来的,是新的应用领域和商业机会 。
再看一个例子:请问图像是数据吗?我相信没有任何人会否认,图像是一种重要的数据 。但是在一百年前,我认为图像不是数据 。为什么?因为我们肉眼凡胎中所见的这个美妙的世界,根本记录不下来,都没有办法记录图像,怎么谈得上分析呢?但是今天,数码成像技术的成熟让所有的图像都能够以非常高的分辨率被记录下来,然后进行分析,然后支撑很多有趣的应用 。例如,脸部识别、指纹识别、车牌号识别,还有医学中的大量的医学影像的分析 。这给我们的社会创造了巨大的价值 。类似的例子还有很多 。例如,生物信息的技术进步产生了Microarray数据,社交网络的兴起产生了社交链数据,物联网的兴起产生了车联网数据,所有这些数据都是记录,因此它们都是数据,所有这些数据,它的产生都依赖于一定的技术手段,因此都有强烈的时代特征 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: