暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Oracle数据库 日常维护手册

数据库微课 2021-04-26
1187

开始学习吧~


 


巡检内容

1.    检查数据库基本状况

在本节中主要对数据库的基本状况进行检查,其中包含:检查Oracle实例状态,检查Oracle服务进程,检查Oracle监听进程,共三个部分。

1.1.   检查Oracle实例状态 

SQL>select instance_name,host_name,startup_time,status,database_status fromv$instance;

 

INSTANCE_NAME  HOST_NAME STARTUP_TIME  STATUS    DATABASE_STATUS

----------------     -------------------    --------------------   ----------   ------------ ----

CKDB             AS14          2009-5-7 9:3     OPEN       ACTIVE

其中“STATUS”表示Oracle当前的实例状态,必须为“OPEN”“DATABASE_STATUS”表示Oracle当前数据库的状态,必须为“ACTIVE”

 

SQL> select name,log_mode,open_mode fromv$database;

 

NAME     LOG_MODE     OPEN_MODE

---------      ------------        -----------------

CKDB     ARCHIVELOG   READ WRITE

其中“LOG_MODE”表示Oracle当前的归档方式。“ARCHIVELOG”表示数据库运行在归档模式下,“NOARCHIVELOG”表示数据库运行在非归档模式下。在我们的系统中数据库必须运行在归档方式下。

1.2.   检查Oracle服务进程

$ps -ef|grep ora_|grep -v grep&&ps-ef|grep ora_|grep -v grep|wc –l

 

oracle   2960     1  0 May07 ?        00:01:02 ora_pmon_CKDB

oracle   2962     1  0 May07 ?        00:00:22 ora_psp0_CKDB

oracle   2964     1  0 May07 ?        00:00:00 ora_mman_CKDB

oracle   2966     1  0 May07 ?        00:03:20 ora_dbw0_CKDB

oracle   2968     1  0 May07 ?        00:04:29 ora_lgwr_CKDB

oracle   2970     1  0 May07 ?        00:10:31 ora_ckpt_CKDB

oracle   2972     1  0 May07 ?        00:03:45 ora_smon_CKDB

oracle   2974     1  0 May07 ?        00:00:00 ora_reco_CKDB

oracle   2976     1  0 May07 ?        00:01:24 ora_cjq0_CKDB

oracle   2978     1  0 May07 ?        00:06:17 ora_mmon_CKDB

oracle   2980     1  0 May07 ?        00:07:26 ora_mmnl_CKDB

oracle   2982     1  0 May07 ?        00:00:00 ora_d000_CKDB

oracle   2984     1  0 May07 ?        00:00:00 ora_s000_CKDB

oracle   2994     1  0 May07 ?        00:00:28 ora_arc0_CKDB

oracle   2996     1  0 May07 ?        00:00:29 ora_arc1_CKDB

oracle   3000     1  0 May07 ?        00:00:00 ora_qmnc_CKDB

oracle   3625     1  0 May07 ?        00:01:40 ora_q000_CKDB

oracle  31594     1  0 Jul20 ?        00:00:00 ora_q003_CKDB

oracle  23802     1  0 05:09 ?        00:00:33 ora_j000_CKDB

19

在检查Oracle的进程命令输出后,输出显示至少应包括以下一些进程:
. Oracle写数据文件的进程,输出显示为:“ora_dbw0_CKDB”
. Oracle写日志文件的进程,输出显示为:“ora_lgwr_ CKDB”
. Oracle监听实例状态的进程,输出显示为:“ora_smon_ CKDB”
. Oracle监听客户端连接进程状态的进程,输出显示为:“ora_pmon_ CKDB”
. Oracle进行归档的进程,输出显示为:“ora_arc0_ CKDB”
. Oracle进行检查点的进程,输出显示为:“ora_ckpt_ CKDB”
. Oracle进行恢复的进程,输出显示为:“ora_reco_ CKDB”

1.3.   检查Oracle监听状态

/home/oracle>lsnrctl status

 

LSNRCTL for Linux: Version 10.2.0.2.0- Production on 23-JUL-2009 14:11:53

Copyright (c) 1991, 2005, Oracle.  All rights reserved.

Connecting to(ADDRESS=(PROTOCOL=tcp)(HOST=)(PORT=1521))

STATUS of the LISTENER

------------------------

Alias                     LISTENER

Version                   TNSLSNR for Linux: Version 10.2.0.2.0- Production

Start Date                07-MAY-2009 09:35:52

Uptime                    77 days 4 hr. 36 min. 0 sec

Trace Level               off

Security                  ON: Local OS Authentication

SNMP                      OFF

Listener Parameter File   data/oracle/product/10.2.0/network/admin/listener.ora

Listener Log File         data/oracle/product/10.2.0/network/log/listener.log

Listening Endpoints Summary...

 (DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=AS14)(PORT=1521)))

Services Summary...

Service "CKDB" has 1 instance(s).

 Instance "CKDB", status READY, has 1 handler(s) for thisservice...

Service "CKDBXDB" has 1 instance(s).

 Instance "CKDB", status READY, has 1 handler(s) for thisservice...

Service "CKDB_XPT" has 1 instance(s).

 Instance "CKDB", status READY, has 1 handler(s) for thisservice...

The command completed successfully

“ServicesSummary”项表示Oracle的监听进程正在监听哪些数据库实例,输出显示中至少应该有“CKDB”这一项。

 

检查监听进程是否存在:

[oracle@AS14 ~]$  ps -ef|grep lsn|grep -v grep

oracle   2954     1  0 May07 ?        00:01:17 data/oracle/product/10.2.0/bin/tnslsnrLISTENER –inherit

2.    检查系统和oracle日志文件

在本节主要检查相关的日志文件,包含:检查操作系统的日志文件,检查Oracle日志文件,检查Oracle核心转储目录,检查Root用户和Oracle用户的email,总共四个部分。

2.1.   检查操作系统日志文件

# cat /var/log/messages |grep failed

查看是否有与Oracle用户相关的出错信息。

2.2.   检查oracle日志文件

[oracle@AS14 ~]$ cat/data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep ora-

[oracle@AS14 ~]$ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log|grep err

[oracle@AS14 ~]$ cat/data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep fail

Oracle在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:数据库的启动、关闭,启动时的非缺省参数;数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因;对数据库进行的某些操作,如创建或删除表空间、增加数据文件;数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA600)等。定期检查日志文件,根据日志中发现的问题及时进行处理:

问题

处理

启动参数不对

检查初始化参数文件

因为检查点操作或归档操作没有完成造成重做日志不能切换

如果经常发生这样的情况,可以考虑增加重做日志文件组;想办法提高检查点或归档操作的效率;

有人未经授权删除了表空间

检查数据库的安全问题,是否密码太简单;如有必要,撤消某些用户的系统权限

出现坏块

检查是否是硬件问题(如磁盘本生有坏块),如果不是,检查是那个数据库对象出现了坏块,对这个对象进行重建

表空间不够

增加数据文件到相应的表空间

出现ORA-600

根据日志文件的内容查看相应的TRC文件,如果是Oraclebug,要及时打上相应的补丁

Listener日志:$ORACLE_HOME/network/log

2.3.   检查Oracle核心转储目录

$ls $ORACLE_BASE/admin/CKDB/cdump/*.trc|wc -l

$ls $ORACLE_BASE/admin/CKDB/udump/*.trc|wc –l

如果上面命令的结果每天都在增长,则说明Oracle进程经常发生核心转储。这说明某些用户进程或者数据库后台进程由于无法处理的原因而异常退出。频繁的核心转储特别是数据库后台进程的核心转储会导致数据库异常终止。

2.4.   检查Root用户和Oracle用户的email

#tail –n 200 /var/mail/root

#tail –n 200 /var/mail/oracle

查看有无与Oracle用户相关的出错信息。

3.    检查Oracle对象状态

在本节主要检查相关Oracle对象的状态,包含:检查Oracle控制文件状态,检查Oracle在线日志状态,检查Oracle表空间的状态,检查Oracle所有数据文件状态,检查Oracle所有表、索引、存储过程、触发器、包等对象的状态,检查Oracle所有回滚段的状态,总共六个部分。

3.1.   检查Oracle控制文件状态

SQL> select status,name from v$controlfile;

 

STATUS NAME

---------------------------------------------------------------------------------------

       /data/oradata/CKDB/control01.ctl

       /data/oradata/CKDB/control02.ctl

       /data/oradata/CKDB/control03.ctl

输出结果应该有3条以上(包含3条)的记录,“STATUS”应该为空。状态为空表示控制文件状态正常。

3.2.   检查Oracle在线日志状态

SQL> select group#,status,type,member fromv$logfile;

 

   GROUP# STATUS  TYPE    MEMBER

---------- ------- ------- -----------

        3         ONLINE  /data/oradata/CKDB/redo03.log

        2         ONLINE  /data/oradata/CKDB/redo02.log

        1         ONLINE  /data/oradata/CKDB/redo01.log

        4         ONLINE  /data/oradata/CKDB/redo04.log

        5         ONLINE  /data/oradata/CKDB/redo05.log

        6         ONLINE  /data/oradata/CKDB/redo06.log

 

6 rows selected

输出结果应该有3条以上(包含3条)记录,“STATUS”应该为非“INVALID”,非“DELETED” 注:“STATUS”显示为空表示正常。

3.3.   检查Oracle表空间的状态

SQL> select tablespace_name,status fromdba_tablespaces;

 

TABLESPACE_NAME                STATUS

------------------------------ ---------

SYSTEM                         ONLINE

UNDOTBS1                       ONLINE

SYSAUX                         ONLINE

TEMP                           ONLINE

USERS                          ONLINE

SJ1                            ONLINE

ADM_INDEX                      ONLINE

HOME_DATA                      ONLINE

HOME_INDEX                     ONLINE

PHOTO_DATA                     ONLINE

PHOTO_INDEX                    ONLINE

。。。。。。。

输出结果中STATUS应该都为ONLINE

3.4.   检查Oracle所有数据文件状态

SQL> select name,status from v$datafile;

 

NAME                                              STATUS

---------------------------------------------------------

/data/oradata/CKDB/system01.dbf                    SYSTEM

/data/oradata/CKDB/undotbs01.dbf                   ONLINE

/data/oradata/CKDB/sysaux01.dbf                    ONLINE

/data/oradata/CKDB/users01.dbf                     ONLINE

/data/oradata/CKDB/sj.dbf                          ONLINE

/data/oradata/CKDB/HOME_DATA1.dbf                  ONLINE

/data/oradata/CKDB/HOME_INDEX1.dbf                 ONLINE

/data/oradata/CKDB/PHOTO_DATA1.dbf                 ONLINE

/data/oradata/CKDB/PHOTO_INDEX1.dbf                ONLINE

/data/oradata/CKDB/BLOG_DATA1.dbf                  ONLINE

/data/oradata/CKDB/BLOG_INDEX1.dbf                 ONLINE

/data/oradata/CKDB/AUDIO_DATA1.dbf                 ONLINE

/data/oradata/CKDB/AUDIO_INDEX1.dbf                ONLINE

/data/oradata/CKDB/VIDEO_DATA1.dbf                 ONLINE

/data/oradata/CKDB/VIDEO_INDEX1.dbf                ONLINE

/data/oradata/CKDB/SYS_DATA1.dbf                   ONLINE

/data/oradata/CKDB/SYS_INDEX1.dbf                  ONLINE

/data/oradata/CKDB/ADM_DATA1.dbf                   ONLINE

/data/oradata/CKDB/ADM_INDEX1.dbf                  ONLINE

/data/oradata/CKDB/perfstat.dbf                    ONLINE

输出结果中“STATUS”应该都为“ONLINE”。或者:

SQL> select file_name,status fromdba_data_files;

 

FILE_NAME                                     STATUS

------------------------------------------------------

/data/oradata/CKDB/users01.dbf                AVAILABLE

/data/oradata/CKDB/sysaux01.dbf               AVAILABLE

/data/oradata/CKDB/undotbs01.dbf              AVAILABLE

/data/oradata/CKDB/system01.dbf               AVAILABLE

/data/oradata/CKDB/sj.dbf                     AVAILABLE

/data/oradata/CKDB/perfstat.dbf               AVAILABLE

/data/oradata/CKDB/HOME_DATA1.dbf             AVAILABLE

/data/oradata/CKDB/HOME_INDEX1.dbf            AVAILABLE

/data/oradata/CKDB/PHOTO_DATA1.dbf            AVAILABLE

输出结果中“STATUS”应该都为“AVAILABLE”

3.5.   检查无效对象

sql>select owner,object_name,object_type fromdba_objects where status!='VALID' and owner!='SYS' and owner!='SYSTEM';

 

no rows selected

如果有记录返回,则说明存在无效对象。若这些对象与应用相关,那么需要重新编译生成这个对象,或者:

SELECT owner, object_name, object_type FROMdba_objects WHERE status= 'INVALID';

3.6.   检查所有回滚段状态

SQL> select segment_name,status fromdba_rollback_segs;

 

SEGMENT_NAME                   STATUS

------------------------------ ----------------

SYSTEM                         ONLINE

_SYSSMU1$                      ONLINE

_SYSSMU2$                      ONLINE

_SYSSMU3$                      ONLINE

_SYSSMU4$                      ONLINE

_SYSSMU5$                      ONLINE

_SYSSMU6$                      ONLINE

_SYSSMU7$                      ONLINE

_SYSSMU8$                      ONLINE

_SYSSMU9$                      ONLINE

_SYSSMU10$                     ONLINE

 

11 rows selected

输出结果中所有回滚段的“STATUS”应该为“ONLINE”

4.    检查Oracle相关资源的使用情况

在本节主要检查Oracle相关资源的使用情况,包含:检查Oracle初始化文件中相关的参数值,检查数据库连接情况,检查系统磁盘空间,检查Oracle各个表空间使用情况,检查一些扩展异常的对象,检查system表空间内的内容,检查对象的下一扩展与表空间的最大扩展值,总共七个部分。

4.1.   检查Oracle初始化文件中相关参数值

SQL> selectresource_name,max_utilization,initial_allocation,

 limit_value from v$resource_limit;

 

RESOURCE_NAME        MAX_UTILIZATION INITIAL_ALLOCATLIMIT_VALUE

-------------------- ------------------------------ ---------------

processes                        162        500             500

sessions                         168        555             555

enqueue_locks                    136       6930            6930

enqueue_resources                111       2660       UNLIMITED

ges_procs                          0          0               0

ges_ress                           0          0       UNLIMITED

ges_locks                          0          0       UNLIMITED

ges_cache_ress                     0          0       UNLIMITED

ges_reg_msgs                       0          0       UNLIMITED

ges_big_msgs                       0          0       UNLIMITED

ges_rsv_msgs                       0          0               0

gcs_resources                      0          0               0

gcs_shadows                        0          0               0

dml_locks                         76       2440       UNLIMITED

temporary_table_locks              26  UNLIMITED       UNLIMITED                                                 

transactions                      13        610       UNLIMITED

branches                          0        610       UNLIMITED

cmtcallbk                          3        610       UNLIMITED

sort_segment_locks                 5  UNLIMITED       UNLIMITED

max_rollback_segments              11        610           65535

RESOURCE_NAME       MAX_UTILIZATIONINITIAL_ALLOCAT LIMIT_VALUE

-------------------- ------------------------------ ---------------

max_shared_servers                 1  UNLIMITED       UNLIMITED

parallel_max_servers              16         80            3600

 

22 rows selected

LIMIT_VALU-MAX_UTILIZATION<=5,则表明与RESOURCE_NAME相关的Oracle初始化参数需要调整。可以通过修改Oracle初始化参数文件$ORACLE_BASE/admin/CKDB/pfile/initORCL.ora来修改。

4.2.   检查数据库连接情况

查看当前会话连接数,是否属于正常范围。

SQL> select count(*) from v$session;

 

 COUNT(*)

----------

       29

 

select sid,serial#,username,program,machine,statusfrom v$session;

SID   SERIAL#     USERNAME       PROGRAM        MACHINE      STATUS

---- ---------- ------------ ---------------------------- --------------------

   1   3                       oracle@xz15saledb(PMON)     xz15saledb  ACTIVE

   2   3                       oracle@xz15saledb(DBW0)     xz15saledb   ACTIVE

   3   3                       oracle@xz15saledb(DBW1)     xz15saledb   ACTIVE

   4   3                       oracle@xz15saledb(LGWR)     xz15saledb   ACTIVE

   5   3                       oracle@xz15saledb(CKPT)     xz15saledb   ACTIVE

   6   3                       oracle@xz15saledb(SMON)     xz15saledb   ACTIVE

   7   3                       oracle@xz15saledb(RECO)     xz15saledb   ACTIVE

   8    1                       oracle@xz15saledb(CJQ0)    xz15saledb   ACTIVE

   9    3                       oracle@xz15saledb(ARC0)    xz15saledb   ACTIVE

  10    3                       oracle@xz15saledb(ARC1)    xz15saledb   ACTIVE

  11  11319   ZK   AccPrtInv_svr@xz15tuxedo2(TNS V1-V3)   xz15tuxedo2  INACTIVE

  13  48876   ZG           upload@xz15saleap(TNS V1-V3)   xz15saleap   INACTIVE

  17  20405   ZK    AccCreateRpt@xz15tuxedo1(TNS V1-V3)   xz15tuxedo1  INACTIVE

  20  12895   ZK       OweScanSvr@xz15billdb(TNS V1-V3)   xz15billdb   INACTIVE

其中:SID  会话(session)ID号;

SERIAL#  会话的序列号,和SID一起用来唯一标识一个会话;

USERNAME  建立该会话的用户名;

PROGRAM  这个会话是用什么工具连接到数据库的;

STATUS  当前这个会话的状态,ACTIVE表示会话正在执行某些任务,INACTIVE表示当前会话没有执行任何操作;

如果建立了过多的连接,会消耗数据库的资源,同时,对一些“挂死”的连接可能需要手工进行清理。如果DBA要手工断开某个会话,则执行:(一般不建议使用这种方式去杀掉数据库的连接,这样有时候session不会断开。容易引起死连接。建议通过sid查到操作系统的spid,使用ps –ef|grep spidno的方式确认spid不是ORACLE的后台进程。使用操作系统的kill -9命令杀掉连接

alter system kill session 'SID,SERIAL#';

注意:上例中SID110(USERNAME列为空)的会话,是Oracle的后台进程,不要对这些会话进行任何操作。

4.3.   检查系统磁盘空间

如果文件系统的剩余空间过小或增长较快,需对其进行确认并删除不用的文件以释放空间。

[oracle@AS14~]$ df -h

Filesystem            Size  Used Avail Use% Mounted on

/dev/sda5             9.7G  3.9G 5.4G  42% /

/dev/sda1             479M   16M 438M   4% /boot

/dev/sda2              49G   19G  28G  41% /data

none                 1014M     0 1014M   0% /dev/shm

4.4.   检查表空间使用情况

SQL> selectf.tablespace_name,a.total,f.free,round((f.free/a.total)*100) "% Free"

 from

 (selecttablespace_name, sum(bytes/(1024*1024)) total from dba_data_files group bytablespace_name) a,

(select tablespace_name, round(sum(bytes/(1024*1024)))free from dba_free_space group by tablespace_name) f

WHERE a.tablespace_name = f.tablespace_name(+)

order by "% Free";

 

TABLESPACE_NAME                     TOTAL       FREE    % Free

------------------------------ ---------- --------------------

OPERATION_DATA                       1800        547         30

WAPWEB_DATA                           100         36         36

OPERATION_INDEX                       500        186         37

SYSTEM                               1024        515        50

SYSAUX                               1024        534         52

SALE8_TEMP                            100         62         62

SJ1                                   500        348         70

PERFSTAT                              500        356        71

……….

HOME_DATA                             100         77         77

SYS_INDEX                             100        100        100

VIDEO_INDEX                           100        100        100

VIDEO_DATA                            100        100        100

BLOG_DATA                             100        100        100

 

39 rows selected

如果空闲率%Free小于10%以上(包含10%),则注意要增加数据文件来扩展表空间而不要是用数据文件的自动扩展功能。请不要对表空间增加过多的数据文件,增加数据文件的原则是每个数据文件大小为2G或者4G,自动扩展的最大限制在8G

4.5.    检查一些扩展异常的对象

sql>selectSegment_Name, Segment_Type, TableSpace_Name,

(Extents/Max_extents)*100Percent

Fromsys.DBA_Segments

WhereMax_Extents != 0 and (Extents/Max_extents)*100>=95

order ByPercent;

 

no rowsselected

如果有记录返回,则这些对象的扩展已经快达到它定义时的最大扩展值。对于这些对象要修改它的存储结构参数。

4.6.    检查system表空间内的内容

selectdistinct(owner) from dba_tables

wheretablespace_name='SYSTEM' and

owner!='SYS'and owner!='SYSTEM'

union

selectdistinct(owner) from dba_indexes

wheretablespace_name='SYSTEM' and

owner!='SYS'and owner!='SYSTEM';

 

no rowsselected

如果记录返回,则表明system表空间内存在一些非systemsys用户的对象。应该进一步检查这些对象是否与我们应用相关。如果相关请把这些对象移到非System表空间,同时应该检查这些对象属主的缺省表空间值。

4.7.    检查对象的下一扩展与表空间的最大扩展值

sql>selecta.table_name, a.next_extent, a.tablespace_name

fromall_tables a,

(selecttablespace_name, max(bytes) as big_chunk

fromdba_free_space

group bytablespace_name ) f

wheref.tablespace_name = a.tablespace_name

anda.next_extent > f.big_chunk

union

selecta.index_name, a.next_extent, a.tablespace_name

fromall_indexes a,

(selecttablespace_name, max(bytes) as big_chunk

from dba_free_space

group bytablespace_name ) f

wheref.tablespace_name = a.tablespace_name

anda.next_extent > f.big_chunk;

 

no rowsselected

记录返回,则表明这些对象的下一个扩展大于该对象所属表空间的最大扩展值,需调整相应表空间的存储参数。

                                   

 学到了吗?有收获吗?

 欢迎大家留言噢~

记得置顶公众号设为星标

 第一时间浏览精彩内容噢~


文章转载自数据库微课,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论