冥王生活

您现在的位置是:首页 > 科技生活 > 正文

科技生活

大数据本质是什么(大数据的真正意义是什么)

admin2022-12-08科技生活101

大数据的本质是什么?

数据本身是一种语言,把业务、系统用数据这种语言表现出来,可视化出来,并应用起来。数据这个语言,即是过程也是结果,是业务和系统行为的过程和结果,所以数据本身不会撒谎,数据本身也不产生价值。这就好比语言本身不产生价值,但语言一旦用来交流、传承,便产生了价值。

数据的价值在于应用,通过数据应用解决商业问题,在市场化的行为中,数据建设也往往需要商业驱动。

所以,数据的本质是商业。大数据、数据中台、数字化转型,为的都是解决商业问题。

大数据的本质

      大数据是一种思维方式,我们称之为“大数据思维”。

      大数据这个概念的提出,是因为人们发现数据能够消除世界的不确定性。但仅仅数据量大,不能称为大数据,能称为大数据的至少要满足三个特征:数据量大,多维度,完备性。

      数据量足够的大。而且这些数据能从多个维度展现要分析对象的特征。数据还足够完整,最好能用穷举法列出有关目标的全部数据。

      工业时代,人们遵循因果关系的工作方式。现在,人们的工作方式是利用大数据,寻找相关性。

      从本质上来看,这是两种不同的思维方式。

什么是大数据?

大数据是指在一定时间内,常规软件工具无法捕捉、管理和处理的数据集合。它是一种海量、高增长、多元化的信息资产,需要一种新的处理模式,以具备更强的决策、洞察和流程优化能力。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业的处理。换句话说,如果把大数据比作一个行业,这个行业盈利的关键在于提高数据的“处理能力”,通过“处理”实现数据的“增值”。

从技术上讲,大数据和云计算的关系就像硬币的正反面一样密不可分。大数据不能用单台计算机处理,必须采用分布式架构。其特点在于海量数据的分布式数据挖掘。但它必须依赖云计算分布式处理、分布式数据库、云存储和虚拟化技术。

扩展信息:

大数据只是现阶段互联网的一个表征或特征。没有必要将其神话或保持敬畏。在以云计算为代表的技术创新背景下,这些原本看似难以收集和使用的数据开始被轻松使用。通过各行各业的不断创新,大数据将逐渐为人类创造更多的价值。

是体现大数据技术价值的手段,是进步的基石。这里从云计算、分布式处理技术、存储技术、感知技术的发展,阐述大数据从采集、处理、存储到形成结果的全过程。

实践是大数据的终极价值。在这里,我们从互联网大数据、政府大数据、企业大数据、个人大数据四个方面来描绘大数据的美好图景和将要实现的蓝图。

大数据的本质是什么?

在著作《大数据的真相》中,列举了3个大数据的本质的特性。

使用所有的数据运用用户行为观察等大数据出现前的分析方法,通常是将调查对象范围缩小至几个人。这是因为,整理所有目标用户的数据实在太费时间,所以采取了从总用户群中,争取不产生偏差地抽取一部分作为调查对象,并仅仅根据那几个人的数据进行分析。

而使用大数据技术,能够通过发达的数据抽选和分析技术,完全可以做到对所有的数据进行分析,以提高数据的正确性。

不拘泥于单个数据的精确度

如果我们连续扔骰子,偶尔会连续好几次都扔出同样的数字。但是如果无限增加扔骰子的次数,每个数字出现的概率都将越来越接近六分之一。同样的,在大数据领域,通过观察数量庞大的数据,更容易提高整体而言的数据的精准度。因此,可以不拘泥于个别数据的精确度,而迅速地进阶到数据分析的步骤。(不过这种情况当然不包括人为的篡改等由于外部因素扭曲了数据的情况)

不过分强调因果关系

企业在考虑服务方针时,会综合考虑现状、问题、改善措施、实施后果等要素之间的相互关系,在此基础上建立假设。但是大数据能够通过观察海量的数据,发现人所注意不到的相互关联。

参考资料

大数据的本质是什么.豆瓣[引用时间2017-12-24]

大数据的本质是什么

大数据有两种含义:一个是海量数据,一个是处理海量数据分析出有用的结论的技术。

具体内容可以看一下这个视频大数据本质

大数据是干嘛的?

一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

大数据的本质就是一大堆结构化的和非结构化的数据。因为数据量太大,你没办法使用,你需要从中抓取出有价值的内容或你想要的数据,这就是大数据应用。

大数据有四个特性,第一个就是高容量,也就是说一定要“大”,至于需要大到什么程度呢,就是要以TB往上走。第二个就是多样化,是区别于以往海量数据挖掘的最主要特征。它有两层含义,一是数据来源多样化,系统数据、设备日志、传感器、文件系统等等来源。二是数据结构多样化,这是核心特征!要包含结构化数据、非结构数据(包括所谓半结构化数据)。

第三个是即时效性,基本上至少也要达到亿级数据一秒查询,做的比较好的可以达到千亿级数据一秒查询。这个特征几乎决定了传统技术架构无法满足要求,因此Hadoop架构的出现催化了大数据的发展,也是有人认为Hadoop就是大数据的原因。第四个是价值,数据一定要有价值、而后才能产生价值。就好比存商品的叫才能仓库,存垃圾的叫垃圾填满坑一样。没价值的数据就像一个垃圾填满坑,这也是为什么数据治理在大数据实施中非常重要的原因之一。

随着时间的推移,数据的积累,随着社会节奏的变化,使用信息化系统的人越来越多,数据积累的速度越来越快,数据也越来越庞大。当规模大到在获取数据,存储数据,管理数据,分析数据方面大大超过了传统数据库软件工具能力范围的数据集合,并且数据的价值越来越大,针对数据的处理就需要专门的企业或者人员来完成,这就是现在大数据(当然,大数据的内涵远远不是这一两句话能够说清楚的)

从技术层面说,大数据和以前的数据时代("小数据")的最大差异在于: 以前是数据找应用、算法的过程,偏重于用抽样推测全局,从抽样数据中分析,没有采集到的样本所对应的相关规律。

而大数据时代的重要技术特征之一,是应用、算法去找数据的过程,因为数据规模变成了技术上最大的挑战,我们更关注每一个个体的微观表现

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~