Sunday, June 10, 2007

workflow

workflow
# 关于发生的现象请详细说明。(必须)

・是否是错误代码/错误信息?

・是否属于bug或时间延迟?

・是否是instance down、node down之类?

・进行了什么样的处理/执行了什么样的命令?

・请告知现象发生的node、精确的时刻。(必须)

・最近数据库、CRS、application有什么相关的变更吗。



# 请告知现象发生的频度。(必须)

・ 是(毎次 / 经常/ 有时候 / 首次 / 其他)中的哪一个?

・ 错误发生的时候处于哪个阶段?(执行处理的时候 / 其他)

・ 是否有可能人工的让现象重现?



# 请告知运行数据库的服务器的环境构成。(必须)

・node名(host名)、node数、instance名(各node上的ORACLE_SID)

・是否存在vendor cluster ware?

・使用ASM的instance了吗?

・请告知数据库的辅助记忆装置。(例:RAW DEVICE、OCFS、NAS、CFS、etc)

・如果node间存在系统时间差、请告知。



# 请告知是否使用个别补丁。(必須)

・使用个别补丁的时候、请告知其BUG#。

(如有可能、请提供最新的opatch的opatch lsinventory –detail之结果的text file。)



# 为了连接数据库、运用了什么工具(Version)?

例) SQL*Plus/Server Manager/Pro*C/Pro*COBOL

请告知是否能通过连接工具进行现象的再现。

还有,是否能通过SQL*Plus进行再现?



# 请告知与application的连接状态和所使用的protocol。(必須)

・连接状态 – 专用服务器连接/MTS(multi・thread・server)连接

・protocol -- TCP/BEQ/IPC/其他



# 为了解决问题、如能再现现象,请提供小型的再现case。

如果不能,请告知不能提供的原因。



# 问题有没有回避的方法?

请告诉回避方法的具体步骤。



# 问题发生是在真正环境还是在试验环境中发生的?

问题对业务和项目有多大程度的影响業務?



# 问题等现象发生后、还能正常使用吗?

另外,问题发生呢后,要复原的话,用该采取什么样的步骤?



# 请提供以下信息。(※ 以下都可从node上获得。)



・数据库相关的log一份

原始参数・file、问题生前一时刻的startup以后的ALERT.LOG,以及

问题生前后48小时生成的thread・file(*.trc)

(thread file是指、bdump、udump 下的全部内容)

(使用ASMinstance的场合、ASM instance方面的相关信息也请一并提供。)



・CRS相关log一份 (10g Release1) 请提供下述目录下的log。

$ORA_CRS_HOME/crs/log、 $ORA_CRS_HOME/css/log、$ORA_CRS_HOME/evm/log、

$ORA_CRS_HOME/racg/dump、$ORACLE_HOME/racg/dump



・Oracle Clusterware(CRS) 相关的log一份 (10g Release2)

请提供下述目录下的log。

$ORA_CRS_HOME/log/<hostname>/crsd、$ORA_CRS_HOME/log/<hostname>/cssd

$ORA_CRS_HOME/log/<hostname>/evmd、$ORA_CRS_HOME/log/<hostname>/racg

$ORACLE_HOME/log/<hostname>/racg



・Linux、Windows上是 9i的时候、提供oracm 的log (cm.log、cmsrvr.<nodename>.log)



・OS方的log

syslog、messages 等、AIX是、errpt、errpt -a

Windows的情况下、提供event log(application log、text形式的system log。)



・问题属于bug,时间延迟的时候、提供SQL_TRACE(event 10046 level 12)和STATSPACK。

另外、请提供OS level的负荷状况相关信息(vmstat、sar、iotstat、top、glance 等)。



# 请告知贵公司调查内容。

・哪个log的哪个地方报错?(或者注意到哪个地方输出的信息有问题?)。

・ 请告知所参考过的相关KROWN、Metalink的信息。



# 另外、注意到哪个地方不正常等,也请告诉我们。

另外、进行障害验证等的时候、请告诉我们贵公司所想定的具体是怎样的验证内容。

No comments: