暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

生活需要断舍离,数据同样需要!

志明与数据 2023-05-31
123



转眼五月最后一天,写一篇随笔,结束这个忙碌的五月。

经常被问及:这个数据要不要入湖,那个数据要不要入仓?

其实,所问之数据,都可能是八辈子也用不上的数据,它们跟“垃圾数据”还不一样。“垃圾数据”至少还可能参与加工,然后生产出更多的“垃圾数据”。而它们,就是死躺在那里,随着系统或机房改造而搬来搬去。至于什么是“垃圾数据”,本篇不延伸。


在什么样的数据堆里,挖呀挖呀挖,
存什么样的脏数,踩什么样的坑🕳️
在小小的数据堆里,挖呀挖呀挖,
存少少的脏数,踩小小的坑🕳️
在大大的数据堆里,挖呀挖呀挖,
存多多的脏数,踩大大的坑🕳️
在特别大的数据堆里,挖呀挖呀挖,
存特别多的脏数,踩特别大的坑🕳️


讲真,在那些数据堆里,不论你怎么挖,也挖不出啥有效价值,只能把锄头给挖坏了。

它们有的是一个早已下线的古董系统留下的原始数据库,有的是不知道哪个系统留下的日志文件,总之它们现在对于他们来说,只能算是一堆历史遗留的二进制文件。

如果舍不得彻底销毁,可以买一些大点的移动硬盘存起来,贴上标签锁保险柜,但是别在现行的数据湖、数据仓库或其他存储引擎中占着茅坑不拉屎。

这时,我突然想到了一个词——“断舍离”。


生活可以断舍离,数据是不是也可以?

先说说啥是断舍离,网上搜到说,断舍离是出自整理收纳界推出的概念,即抛弃不必要的物品和思维模式,获得更简单、更轻松的生活方式。具体而言,断舍离包括三个方面:,即停止购买过度的物品和服务;,是指把无用的物品和不必要的想法彻底丢掉;则是抛弃冗余的物品和关系,只留下自己需要的最少量。断舍离的目的在于减少物品和思维的杂乱,让生活变得更简单、更安稳。

那换成数据呢?如在数据治理的语境下。

数据治理是指确保组织内的数据安全、可靠、完整、可访问和可用的过程。断舍离则是指过滤、清洗和精简组织中无用的、重复的或过时的信息和资源。将两者结合,可以强化数据治理的效果。

首先,通过断舍离去除组织中无用的、重复的或过时的信息和资源,可以减少数据存储和管理的工作量,同时缩短数据查询和处理的时间。减少不必要的数据也可以降低数据管理成本。

其次,断舍离也可以帮助清除数据质量问题,如数据冗余、不一致、缺失等。当组织中存在大量无效的或者冗余的数据时,数据治理工作会变得更困难。通过断舍离,我们能够减少这些问题,并且使处理数据变得更加容易。

总之,通过将数据治理和断舍离结合起来,可以帮助组织更有效地管理和利用数据,提高数据的质量和价值。

那我们可以怎么做呢?

在当前,我们面对海量的数据和信息时,需要学会分清重要的和不重要的,及时删除和清理不必要的数据,以保持自己的信息流畅和干净。这样可以提高工作效率,减少信息干扰,使自己更加专注和高效。

数据断舍离的方法包括:

1、定期清理:定期审核自己的数据和信息,把不必要的、重复的、过期的等删掉或整理好。

2、分类归档:把数据和信息按类别或主题分类整理好,方便查找和使用。

3、保持简洁:避免过多的重复信息,尽量保持简洁和精炼。

4、养成好习惯:养成及时整理和清理数据和信息的好习惯,减少无用的信息噪音。

5、学会评估价值:学会分辨数据和信息的价值,有针对性地筛选和保留重要的数据和信息。


写在最后
生活,需要通过断舍离的方式做减法,在数据从业过程中,一样也需要做减法,不要为了一些毫无价值的数据,去消耗存储成本,去消耗人力成本,去消耗管理成本,甚至针对这些数据去做无脑确权和认责。

断舍离,减与不减,你的数据,你做主。

学会断舍离,生活/工作才能更加轻松。

愿你像孩子一样简单快乐,预祝大家六一儿童节快乐!



——所有图片来自网络,所有言论谨代表个人。

文章转载自志明与数据,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论