排行
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
中国数据库
向量数据库
时序数据库
实时数据库
搜索引擎
空间数据库
图数据库
数据仓库
大调查
2021年报告
2022年报告
年度数据库
2020年openGauss
2021年TiDB
2022年PolarDB
2023年OceanBase
首页
资讯
活动
大会
学习
课程中心
推荐优质内容、热门课程
学习路径
预设学习计划、达成学习目标
知识图谱
综合了解技术体系知识点
课程库
快速筛选、搜索相关课程
视频学习
专业视频分享技术知识
电子文档
快速搜索阅览技术文档
文档
问答
服务
智能助手小墨
关于数据库相关的问题,您都可以问我
数据库巡检平台
脚本采集百余项,在线智能分析总结
SQLRUN
在线数据库即时SQL运行平台
数据库实训平台
实操环境、开箱即用、一键连接
数据库管理服务
汇聚顶级数据库专家,具备多数据库运维能力
数据库百科
核心案例
行业报告
月度解读
大事记
产业图谱
我的订单
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
资讯
活动
大会
课程
文档
排行
问答
我的订单
首页
专家团队
智能助手
在线工具
SQLRUN
在线数据库即时SQL运行平台
数据库在线实训平台
实操环境、开箱即用、一键连接
AWR分析
上传AWR报告,查看分析结果
SQL格式化
快速格式化绝大多数SQL语句
SQL审核
审核编写规范,提升执行效率
PLSQL解密
解密超4000字符的PL/SQL语句
OraC函数
查询Oracle C 函数的详细描述
智能助手小墨
关于数据库相关的问题,您都可以问我
精选案例
新闻资讯
云市场
登录后可立即获得以下权益
免费培训课程
收藏优质文章
疑难问题解答
下载专业文档
签到免费抽奖
提升成长等级
立即登录
登录
注册
登录
注册
首页
专家团队
智能助手
精选案例
新闻资讯
云市场
微信扫码
复制链接
新浪微博
分享数说
采集到收藏夹
分享到数说
首页
/
驭云上数据势能——搜狐畅游游戏实战
驭云上数据势能——搜狐畅游游戏实战
腾讯云数据库
2020-09-18
1063
释放数据价值,助力数智转型,本次腾讯全球数字生态大会数据库专场中,各路大咖为我们带来腾讯云数据库的最新动态:全域解决方案、TDSQL新品发布、合作伙伴计划……以下是搜狐畅游数据库团队的负责人李凌在大会分享的图文和视频回顾,请查收~
关注“腾讯云数据库”公众号,回复“畅游”,即可下载直播分享PPT。
各位嘉宾大家好,我是来自畅游的数据库团队负责人——李凌,很高兴在这里与大家分享畅游腾讯云数据库的使用经验。
畅游是一家全球化的游戏公司,5年前,畅游选择了腾讯云作为畅游全球云产品供应商之一,而这5年来,腾讯云一直为畅游提供优质高效的公有云和混合云服务,目前畅游绝大多数业务已经从自建IDC迁移到了云上。
在此,我从三个方面分享畅游在腾讯云数据库方面的使用经验,这三个方面分别是:高效的数据库快速恢复,智能化、可视化的数据库优化管理和稳定可靠的全球网络加速。
对于任何一家公司来讲,核心数据的安全是重中之重,在畅游数据库云化的过程中,对于数据库,我们除了兼容性和性能之外会优先去了解的功能就是数据恢复,而腾讯云的数据恢复我们进行了完整的测试,测试的结果也相当让我们满意。畅游之前的备份系统是使用官方原生的mysqldump+binlog 进行逻辑备份和恢复,出现故障需要恢复数据的情况是:平均数据的恢复时间在两到三个小时左右。
而在我们改用腾讯云定制过的数据库恢复系统的时候,经过我们的测试可以发现,全量数据恢复的平均时间会较之前缩短2/3,另外,让我们比较惊喜的是腾讯云控制台界面提供了三个等级的恢复服务,其中就包含了基于表级别的数据库极速恢复功能。畅游有部分业务在上云之前,为了提高恢复速度进行了核心表的独立备份,而现在这个功能腾讯云数据库备份系统替我们实现了,这个系统进一步节省了我们的维护成本,在整个系统使用的过程中我们其实也踩了不少坑,也攒了不少经验,在这里与大家分享:
第一点非常重要,我们
目前的恢复系统的版本
只支持原库回档,所以
在回档的期间
它对原库是有IO消耗的,
但是它没有对原表加锁,
所以大家千万要注意
在不停机回档的时候
一定是要先去看
原
库的
压力有多大,在
压力较大的时候极
有可能造成数据库的访问异常。
通常作为游戏数据库的使用方,
我们都会先挂维护页,
之后再进
行
数据库
回档的操作,
这样会更安全。
第二点
,
经常会有同学问我:
为什么
我现在回档失败了?
我之前想要回档的表不见
了?
其实很简
单,
如果
原表被drop掉了,
那么恢复的时候就
需要创建原表结构
才可以继续恢
复。
第三点,
其实在云时代
很多公司依托于云并
没有专业的DBA,而
我作为一个资深的D
B
A
想要提醒大家一句,
作
为数据的管理者,
在数据恢复之前请保留现场,
这是一个研发同学
非常容易忽略的问题。
如果现场恢复坏了,
你没有保留现场,
那你就没有选择。相比之下,
腾讯云备份系统
提供了三种回
档模式,
第一是普通模式,
它是一个全库的冷备,
全实例的冷备
加上binlog恢复
这个是使用范围最
广
而没有任何限制的模式;
第二种是快速模式,
它可以提供库级别的数据恢复,
这边有一个要求
就是在恢复过程中
有关联库操作的话
就要选择关联库一同恢复;
第三个是极速模式
,也
是我们用的最多的模
式,
它限制会更小,
如果核心表之外的表
在同一个事务中被更新,
那你在恢复的时候就
需要把这张核心表之外的表
同
样勾
选。
最后一点,
腾讯云数据库
虽然提供的功能比较完善,
恢复的功能也相对完善了,
但大家在操作之前,尤其是
在第一次操作之前
一定要仔细看完相关的帮助文档,
帮助文档上会很明确的说明
各种恢复模式的限制。而
这张PPT上
的第三部分
就是文档当中的截
取。
现在我们来讲第二个部分——
智能化的数据库管家DBbrain,
我上面写了5倍的工作效率提升,
提升在哪里?
第一来自于日常排障,
它能很快地
把你的排障效率提升上来;
第二
它可以指导初级同学排障;第三就是
我
们有大量的时间,
在上线前都会与研
发进行沟通
数据库优化的问题。
而我们将DBbrain这个产品
下
放给研发使用,
它能大幅的
降
低
我们与研发的沟通成本,
研发也可以自助进行数据库优化。
畅游是第一批
使用DBbrain的公司之一,
在邀测和公测期间
我们也和DBbrain的产品同学
进行了深入的交流与探讨,
D
B
brain这个产品
是可以增强数据库稳定性的。
我举个例子来说,首先
它是一个7×24小时的
实时采集系
统和实时分析系统;
第二点,
它是可以提高管理效率的,
每次管理
大家都不需要再去登陆本机,
而是通过DBbrain可以做集中管理,
特别是集中的数据库优化的分析;
第三点,有部分功能
在DBbrain中
变成了一键式的操作,
大量节省了运维成本;
第
四点,
所有在DBbrain中的操作
都是可审计的,也就是说
安全性
是有保证的。
我们畅游的应用场景
有五大类:
第一类是可视化的慢查询线程,包括
删除和清理
,
第二类是快速定位性能问题,
第三类就是刚才说到的
研发自主优化,
第四类就是日常巡检
,
包括我们的日检、月检、
进度巡检和年检,
最后就是它提供
的
完善的性能分析报告,
每一个研发同学,
都
有可能在迭代代码之后
去
看性能分析报告
来确认代码中的SQL是否有问题。
下面这张图是数据库智能管家
DBbrain的一张官方架构图,
我们从架构图上去分
析,
它是一个流式数据处理、
实时数据监控和
实时数据分析的产品
,
这是我们所
看
重
和愿意去尝试的关键点之一。
它不光会采集异常时段的数据,
还会采集正常时段的数据,
并在危险发生之前给予提示——
这比发生了危险再处理更有效。
我们看一下常用功能,第一个是
KILL会话,
其实在这里面,
大家可以很明确的看到
只需要勾选你觉得异常的会话,
然后点击KILL会话,
就可以清理掉
你觉得有异常的问题,
让数据库暂时恢复正常。
并且在更新的版本中,
如CDB5.7中
它提供了SQL限流功能,
还有热点的更新保护功能。
这些畅游还没有开始尝试,
但是是未来发展的方向。
我们看一下
我们传统定位数据库问题,
如果发现了服务异常,
我们怎么能判定是数据库的问题呢?
传统的做法是罗列所有的指标
然后解析我们现在数据库
出现的慢SQL,
然后综合准备优化方案,最后
处理。
DBbrain是怎么处理的?
第一,它不需要罗列指标
去做人为的分析,
它已经有过了分析模板,
有持续的分析和处理建议的提供
整体的流程,
较比人工分析更快;
第二,它提供了优化建议,
这个建议可以供大家参考,
特
别是供初级的同学参考;
第三 它也提供了快速处理的预案:
有建议也有有解决方案。
我们另外一个常用功能是
慢查询分析,
大家用过传统的
标准MySQL数据库
都知道,在开源版的
标准MySQL数据库
是不提供图形化界面的,
而DBbrain提供了一个可视化的、
一目了然的问题分析界面和平台
并提供了建议,
那么我们在使用这个的过程中,
其实发现了一些小的
需要大家注意的点:
第一个点是
慢查询的默认阈值,
在腾讯云数据库实例中
定义为10秒,
这个是在数据库参数设定中设置的,
大家可以根据自己任务情况去调整。
通常我们畅游来说
都会设置在1秒以内。
第二点:
优化建议的准确率在80%左右,因此
综合实际情况来判断
是非常重要的一件事情。
第三点:
加索引要慎重,
虽然DBbrain会为你提供
合理的优化建议,
但这个建议涉及到删添索引的时候
一定要慎重,
每一个索引的处理
都可能对线上造成锁死
并影响线上的查询和写入的性能,
这个需要有一定的专业知识。
下面这张图
是DBbrain的一个单机巡检报告,
它从六个纬度去看了数据库
六
个纬度的性能,
并出了一个评分值,接着
把它认为有问题的地方
写下来。
我们这个报告
通常会提供给研发同学来参考
每次上线和每次测试的时候
数据库的问题。
同样这样一份报告给DBA拿到手,
DBA也可以通过它来优化
现有的服务。
看报告的好处就是说
至少我们能更近和更早一步地
发现故障和
解决它。
最后一个功能是
数据库巡检,
我为什么会把这一页单独拿出来说?
大多数公司的同学
都会有这个经历,
每到年底了、
季度末了
都会对现有的数据库
做一次完整的巡检
。
那么现在不需要大家
自己写程序做了,
DBbrain会帮你做
,
而且它提供了导出功能:
导成excel
大家可以做数据分析,
这也是一个非常实用的功能。
下面我们来说一下
Anycast在数据库领域的应用,
通常Anycast这个产品
畅游是用来做全球同服的,
随着畅游海外业务的大发展,
全球同服业务也在畅游开始上马。
以某个海外业务为例,
主要对香港、日、韩和北美洲发行,
其实我们知道,
海外用户
根据你的游戏类型不同
会聚集在北美和日韩,
我们多次分析和论证玩家的分布
和各地网络的情况,最终将
该项目的游戏服部署在了美国西部(以下简称美西),
日、韩和香港的玩家
通过anycast加速连到美
西,
玩家实际的登录速度
延时在200毫秒左右
完全能满足玩家的游戏体验需
求。
对我们来说
节省了大量
在日韩部署的硬件资源成本。
数据汇聚在了美西,
这是一个最常用的应用,
数据会通过Anycast的加速通道
从美西压缩之后
回传到国内的畅游数据中心
进行分
析
,
这看起来可能跟数据库关系不大,
但我们说
一
下
这个应用的延伸:
我们从北美数据中心
到畅游北京数
据
中心
之前是通过压缩包传输数据
,
最开始是通过公网来传输数据的,
畅游的北美数
据
中心
走公网传输到畅游北京数据中心
通常的延时会在300毫秒以上,
而且稳定性基本
上
没有保证。
当我们在应用了Anycast加速之后,
畅游的数据传输
时延从300毫秒
降低到150到200毫秒之间,
而且由于Anycast是多通道的加速,
当某一个
通道出现问题的时候
会有备用通道顶上,
在真实业务的使用当中
目前还未遇到过长时间断网的情况。
我们在这上面发现
,
其实Anycast的通道
就是对TCP通道的连接
做了一次腾讯云内网的加速
而走腾讯云内网的国际专线
来提高我们访问的稳定性。
在畅游数据库团
队
看到了这一
点,
北美数据中心到北京数据中心的
所有的
数据库的数据同
步
也同样使用了Anycast进行加速,
我们也取得了比较好的效果。
以上三个功能
是畅游数据库团队
在使用中
比
较在意的三个功能,
能在基础的数据库稳定性之
外
还为数据库服务
附加了更多在安全性和
易用性上的价
值
,
希望本次分享能让大家有所收获,
谢谢!
特惠体验云数据库
↓↓更多惊喜优惠请点这儿~
数据库
文章转载自
腾讯云数据库
,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。
评论
领墨值
有奖问卷
意见反馈
客服小墨