排行
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
中国数据库
向量数据库
时序数据库
实时数据库
搜索引擎
空间数据库
图数据库
数据仓库
大调查
2021年报告
2022年报告
年度数据库
2020年openGauss
2021年TiDB
2022年PolarDB
2023年OceanBase
首页
资讯
活动
大会
学习
课程中心
推荐优质内容、热门课程
学习路径
预设学习计划、达成学习目标
知识图谱
综合了解技术体系知识点
课程库
快速筛选、搜索相关课程
视频学习
专业视频分享技术知识
电子文档
快速搜索阅览技术文档
文档
问答
服务
智能助手小墨
关于数据库相关的问题,您都可以问我
数据库巡检平台
脚本采集百余项,在线智能分析总结
SQLRUN
在线数据库即时SQL运行平台
数据库实训平台
实操环境、开箱即用、一键连接
数据库管理服务
汇聚顶级数据库专家,具备多数据库运维能力
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
我的订单
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
资讯
活动
大会
课程
文档
排行
问答
我的订单
首页
专家团队
智能助手
在线工具
SQLRUN
在线数据库即时SQL运行平台
数据库在线实训平台
实操环境、开箱即用、一键连接
AWR分析
上传AWR报告,查看分析结果
SQL格式化
快速格式化绝大多数SQL语句
SQL审核
审核编写规范,提升执行效率
PLSQL解密
解密超4000字符的PL/SQL语句
OraC函数
查询Oracle C 函数的详细描述
智能助手小墨
关于数据库相关的问题,您都可以问我
精选案例
新闻资讯
云市场
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
专家团队
智能助手
精选案例
新闻资讯
云市场
微信扫码
复制链接
新浪微博
分享数说
采集到收藏夹
分享到数说
首页
/
生活需要断舍离,数据同样需要!
生活需要断舍离,数据同样需要!
志明与数据
2023-05-31
123
转眼五月最后一天,写一篇随笔,结束这个忙碌的五月。
经常被问及:这个数据要不要入湖,那个数据要不要入仓?
其实,所问之数据,都可能是八辈子也用不上的数据,它们跟“垃圾数据”还不一样。“垃圾数据”至少还可能参与加工,然后生产出更多的“垃圾数据”。而它们,就是死躺在那里,随着系统或机房改造而搬来搬去。至于什么是“垃圾数据”,本篇不延伸。
在什么样的数据堆里,挖呀挖呀挖,
存什么样的脏数,踩什么样的坑🕳️
在小小的数据堆里,挖呀挖呀挖,
存少少的脏数,踩小小的坑🕳️
在大大的数据堆里,挖呀挖呀挖,
存多多的脏数,踩大大的坑🕳️
在特别大的数据堆里,挖呀挖呀挖,
存特别多的脏数,踩特别大的坑🕳️
讲真,在那些数据堆里,不论你怎么挖,也挖不出啥有效价值,只能把锄头给挖坏了。
它们有的是一个早已下线的古董系统留下的原始数据库,有的是不知道哪个系统留下的日志文件,总之它们现在对于他们来说,只能算是一堆历史遗留的二进制文件。
如果舍不得彻底销毁,可以买一些大点的移动硬盘存起来,贴上标签锁保险柜,但是别在现行的数据湖、数据仓库或其他存储引擎中占着茅坑不拉屎。
这时,我突然想到了一个词——“断舍离”。
生活可以断舍离,数据是不是也可以?
先说说啥是断舍离,网上搜到说,断舍离是出自整理收纳界推出的概念,即抛弃不必要的物品和思维模式,获得更简单、更轻松的生活方式。具体而言,断舍离包括三个方面:
断
,即停止购买过度的物品和服务;
舍
,是指把无用的物品和不必要的想法彻底丢掉;
离
则是抛弃冗余的物品和关系,只留下自己需要的最少量。断舍离的目的在于减少物品和思维的杂乱,让生活变得更简单、更安稳。
那换成数据呢?如在数据治理的语境下。
数据治理是指确保组织内的数据安全、可靠、完整、可访问和可用的过程。断舍离则是指过滤、清洗和精简组织中无用的、重复的或过时的信息和资源。将两者结合,可以强化数据治理的效果。
首先,通过断舍离去除组织中无用的、重复的或过时的信息和资源,可以减少数据存储和管理的工作量,同时缩短数据查询和处理的时间。减少不必要的数据也可以降低数据管理成本。
其次,断舍离也可以帮助清除数据质量问题,如数据冗余、不一致、缺失等。当组织中存在大量无效的或者冗余的数据时,数据治理工作会变得更困难。通过断舍离,我们能够减少这些问题,并且使处理数据变得更加容易。
总之,通过将数据治理和断舍离结合起来,可以帮助组织更有效地管理和利用数据,提高数据的质量和价值。
那我们可以怎么做呢?
在当前,我们面对海量的数据和信息时,需要
学会
分清重要的和不重要的,及时删除和清理不必要的数据,以保持自己的信息流畅和干净。这样可以提高工作效率,减少信息干扰,使自己更加专注和高效。
数据断舍离的方法包括:
1、定期清理:
定期审核自己的数据和信息,把不必要的、重复的、过期的等删掉或整理好。
2、分类归档:
把数据和信息按类别或主题分类整理好,方便查找和使用。
3、保持简洁:
避免过多的重复信息,尽量保持简洁和精炼。
4、养成好习惯:
养成及时整理和清理数据和信息的好习惯,减少无用的信息噪音。
5、学会评估价值:
学会分辨数据和信息的价值,有针对性地筛选和保留重要的数据和信息。
写在最后
生活,需要通过断舍离的方式做减法,在数据从业过程中,一样也需要做减法,不要为了一些毫无价值的数据,去消耗存储成本,去消耗人力成本,去消耗管理成本,甚至针对这些数据去做无脑确权和认责。
断舍离,减与不减,你的数据,你做主。
学会断舍离,生活/工作才能更加轻松。
愿你像孩子一样简单快乐,预祝大家六一儿童节快乐!
——所有图片来自网络,所有言论谨代表个人。
大数据
文章转载自
志明与数据
,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
领墨值
有奖问卷
意见反馈
客服小墨