知识大全 oracle系统紧急故障处理

Posted 数据库

篇首语:引诱肉体的是金钱和奢望,吸引灵魂的是知识和理智。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 oracle系统紧急故障处理相关的知识,希望对你有一定的参考价值。

   Oracle物理结构故障的处理方法     Oracle物理结构故障是指构成数据库的各个物理文件损坏而导致的各种数据库故障 这些故障可能是由于硬件故障造成的 也可能是人为误操作而引起 所以我们首先要判断问题的起因 如果是硬件故障则首先要解决硬件问题 在无硬件问题的前提下我们才能按照下面的处理方发来进一步处理      控制文件损坏     控制文件记录了关于oracle的重要配置信息 如数据库名 字符集名字 各个数据文件 日志文件的位置等等信息 控制文件的损坏 会导致数据库异常关闭 一旦缺少控制文件 数据库也无法启动 这是一种比较严重的错误     可以通过查询数据库的日志文件来定位损坏了的控制文件 日志文件位于$ORACLE_BASE/admin/bdump/alert_ORCL ora      损坏单个控制文件      确保数据库已经关闭 如果没有用下面的命令来关闭数据库   svrmgrl>shutdown immediate;     查看初始化文件$ORACLE_BASE/admin/pfile/initORCL ora 确定所有控制文件的路径      用操作系统命令将其它正确的控制文件覆蓋错误的控制文件      用下面的命令重新启动数据库  svrmgrl>startup;     用适当的方法进行数据库全备份      损坏所有的控制文件      确保数据库已经关闭 如果没有用下面的命令来关闭数据库   svrmgrl>shutdown immediate;     从相应的备份结果集中恢复最近的控制文件 对于没有采用带库备份的点可以直接从磁带上将最近的控制文件备份恢复到相应目录 对于采用带库备份的点用相应的rman脚本来恢复最近的控制文件      用下面的命令来创建产生数据库控制文件的脚本   svrmgrl>startup mount;  svrmgrl>alter database backup controlfile to trace noresetlogs;     修改第三步产生的trace文件 将其中关于创建控制文件的一部分语句拷贝出来并做些修改 使得它能够体现最新的数据库结构 假设产生的sql文件名字为createcontrol sql     注意     Trace文件的具体路径可以在执行完第 )步操作后查看$ORACLE_BASE/admin/bdump/alert_ORCL ora文件来确定      用下面命令重新创建控制文件   svrmgrl>shutdown abort;  svrmgrl>startup nomount;  svrmgrl>@createcontrol sql;   用适当的方法进行数据库全备份      重做日志文件损坏     数据库的所有增 删 改都会记录入重做日志 如果当前激活的重做日志文件损坏 会导致数据库异常关闭 非激活的重做日志最终也会因为日志切换变为激活的重做日志 所以损坏的非激活的重做日志最终也会导致数据库的异常终止 在ipas/mSwitch中每组重做日志只有一个成员 所以在下面的分析中只考虑重做日志组损坏的情况 而不考虑单个重做日志成员损坏的情况      确定损坏的重做日志的位置及其状态      如果数据库处于可用状态   select * from v$logfile;  svrmgrl>select * from v$log;     如果数据库处于已经异常终止   svrmlgr>startup mount;  svrmgrl>select * from v$logfile;  svrmgrl>select * from v$log;  其中 logfile的状态为INVALID表示这组日志文件出现已经损坏 log状态为Inactive 表示重做日志文件处于非激活状态 Active 表示重做日志文件处于激活状态 Current 表示是重做日志为当前正在使用的日志文件      损坏的日志文件处于非激活状态      删除相应的日志组   svrmgrl>alter database drop logfile group group_number;     重新创建相应的日志组   svrmgrl>alter database add log file group group_number ( log_file_descritpion …) size log_file_size;     损坏的日志文件处于激活状态且为非当前日志      清除相应的日志组   svrmgrl>alter database clear unarchived logfile group group_number;    损坏的日志文件为当前活动日志文件     用命令清除相应的日志组   svrmgrl>alter database clear unarchived logfile group group_number;  如果清除失败 则只能做基于时间点的不完全恢复     打开数据库并且用适当的方法进行数据库全备份   svrmgrl>alter database open;     部分数据文件损坏     若损坏的数据文件属于非system表空间 则数据库仍然可以处于打开状态可以进行操作 只是损坏的数据文件不能访问 这时在数据库打开状态下可以单独对损坏的数据文件进行恢复 若是system表空间的数据文件损坏则数据库系统会异常终止 这时数据库只能以Mount方式打开 然后再对数据文件进行恢复 可以通过查看数据库日志文件来判断当前损坏的数据文件到底是否属于system表空间      非system表空间的数据文件损坏     确定损坏的文件名字   svrmgrl>select name from v$datafile where status= INVALID ;     将损坏的数据文件处于offline状态   svrmgrl>alter database datafile datafile_name offline;     从相应的备份结果集中恢复关于这个数据文件的最近的备份 对于没有采用带库备份的点可以直接从磁带上恢复 对于用带库备份的点用相应的rman脚本来恢复      恢复数据文件   svrmgrl>alter database recover datafile file_name ;     使数据库文件online   svrmgrl>alter database datafile datafile_name online;     用适当的方法进行数据库全备份      system表空间的数据文件损坏      以mount方式启动数据库  svrmgrl>startup mount;     从相应的备份结果集中恢复关于这个数据文件的最近的备份 对于没有采用带库备份的点可以直接从磁带上恢复 对于用带库备份的点用相应的rman脚本来恢复      恢复system表空间   svrmgrl>alter database recover datafile datafile_name ;     打开数据库   svrmgrl>alter database open;     用适当的方法进行数据库全备份      表空间损坏     若非system表空间已经损坏 则数据库仍然可以处于打开状态可以进行操作 只是损坏的表空间不能访问 这样在数据库打开状态下可以单独对损坏的表空间进行恢复 若是system表空间损坏则数据库系统会异常终止 这时数据库只能以Mount方式打开 然后再对表空间进行恢复 可以通过查看数据库日志文件来判断当前损坏的表空间是否是system表空间      非system表空间损坏      将损坏的表空间处于offline状态   svrmgrl>alter tablespace tablespace_name offline;     从相应的备份结果集中恢复关于这个表空间最近的备份 对于没有采用带库备份的点可以直接从磁带上恢复 对于用带库备份的点用相应的rman脚本来恢复      恢复表空间   svrmgrl>alter database recover tablespace tablespace_name ;     使表空间online   svrmgrl>alter tablespace tablespace_name online;     用适当的方法进行数据库全备份     system表空间损坏      以mount方式启动数据库  svrmgrl>startup mount;     从相应的备份结果集中恢复system表空间最近的备份 对于没有采用带库备份的点可以直接从磁带上恢复 对于用带库备份的点用相应的rman脚本来恢复      恢复system表空间   svrmgrl>alter database recover tablespace system;     打开数据库   svrmgrl>alter database open;     用适当的方法进行数据库全备份      整个数据库的所有文件损坏     整个数据库所有文件的损坏一般是在共享磁盘阵列发生无法恢复的灾难时才发生 这种情况下只能对数据库进行恢复 若数据库的归档目录也已经丢失 则数据库不可能做完全恢复 会有用户数据的丢失      没采用带库备份的现场      将最近的备份从磁带上把各个文件解包到相应的目录下      以mount方式打开数据库   svrmgrl>startup mount;     恢复数据库   svrmgrl>recover database until cancel;     打开数据库   svrmgrl>alter database open resetlogs;     用适当的方法进行数据库全备份      采用带库备份的现场      以nomount方式打开数据库   svrmgrl>startup nomount;     通过相应的rman脚本进行数据库软恢复   $rman cmdfile=hot_database_restore rcv     打开数据库   svrmgrl>alter database open resetlogs;     用适当的方法进行数据库全备份     存在最近的数据库完整冷备份前提下的一些经典紧急情况的处理     数据文件 归档重作日志和控制文件同时丢失或损坏      无新增archives 时的状况     条件和假设 自上次镜像备份以来尚未生成新的archive log(s); Archivelog Mode; 有同步的datafile(s) 和control file(s) 的镜像(冷)拷贝    恢复步骤      将镜像拷贝的datafile(s) 和control file(s) 抄送回原始地点:  $ cp /backup/good_one dbf /orig_loc/bad_one dbf  $ cp /backup/control ctl /disk /control ctl     以mount 选项启动数据库   $ svrmgrl  svrmgrl> connect internal  svrmgrl> startup mount     以旧的control file 来恢复数据库   svrmgrl> recover database using backup controlfile until cancel;  *** 介质恢复完成  (必须马上cancel )     Reset the logfiles (对启动而言不可省略)   svrmgrl> alter database open resetlogs;     关闭数据库并做一次全库冷备份      新增archives 时的状况     条件和假设 自上次镜像备份以来已经生成新的archive log(s); Archivelog Mode; 有同步的datafile(s) 和control file(s) 的镜像(冷)拷贝 archive log(s) 可用     恢复步骤      如果数据库尚未关闭 则首先把它关闭   $ svrmgrl  svrmgrl> connect internal  svrmgrl> shutdown abort     将备份文件抄送回原始地点   所有Database Files  所有Control Files(没有archive(s) 或redo(s) 的情况下 control files 的更新无任何意义)  所有On Line Redo Logs (Not archives)  init ora file(选项)     启动数据库   $ svrmgrl  svrmgrl> connect internal  svrmgrl> startup     数据文件 重作日志和控制文件同时丢失或损坏     条件和假设 Archivelog Mode; 有同步的所有所失文件的镜像(冷)拷贝 archive log(s) 可用     恢复步骤(必须采用不完全恢复的手法)      如果数据库尚未关闭 则首先把它关闭   $ svrmgrl  svrmgrl> connect internal  svrmgrl> shutdown abort     将备份文件抄送回原始地点   所有Database Files  所有Control Files  所有On Line Redo Logs(Not archives)  init ora file(选项)     启动数据库然而并不打开   svrmgrl>startup mount     做不完全数据库恢复 应用所有从上次镜像(冷)备份始积累起来的archives   svrmgrl> recover database until cancel using backup controlfile;        cancel     Reset the logfiles (对启动而言不可省略)   svrmgrl> alter database open resetlogs;     关闭数据库并做一次全库冷备份      数据文件和控制文件同时丢失或损坏     条件和假设 Archivelog Mode; 有同步的datafile(s) 和control file(s) 的冷拷贝 archive log(s) 可用    恢复步骤      将冷拷贝的datafiles(s) 和control file(s) 抄送回原始地点:  $ cp /backup/good_one dbf /orig_loc/bad_one dbf  $ cp /backup/control ctl /disk /control ctl     以mount 选项启动数据库   $ svrmgrl  svrmgrl> connect internal  svrmgrl> startup mount     以旧的control file 来恢复数据库   svrmgrl> recover database until cancel using backup controlfile;  *** 介质恢复完成  (须在应用完最后一个archive log 后cancel )     Reset the logfiles (对启动而言不可省略)   svrmgrl> alter database open resetlogs;     重作日志和控制文件同时丢失或损坏时     条件和假设 Control Files 全部丢失或损坏 Archivelog Mode; 有Control Files 的镜像(冷)拷贝     恢复步骤      如果数据库尚未关闭 则首先把它关闭   $ svrmgrl  svrmgrl> connect internal  svrmgrl> shutdown abort  svrmgrl>exit     以Control File 的镜像(冷)拷贝覆蓋损坏了的Control File:  $ cp /backup/control ctl /disk /control ctl     启动数据库然而并不打开   $ svrmgrl  svrmgrl> connect internal  svrmgrl> startup mount     Drop 坏掉的redo log (排除硬件故障)   svrmgrl> alter database drop logfile group ;     重新创建redo log:  svrmgrl> alter database add logfile group /orig_loc/log dbf size M;     以旧的control file 来恢复数据库   svrmgrl> recover database until cancel using backup controlfile;  (必须马上cancel )     Reset the logfiles (对启动而言不可省略)   svrmgrl> alter database open resetlogs;     关闭数据库并做一次全库冷备份     只发生归档重作日志丢失或损坏时     根据不同环境和情况 选择下述手段之一     a 马上backup 全部datafiles (如果系统采用一般热备份或RMAN 热备份)    b 马上正常关闭数据库并进行冷备份(如果系统采用冷备份)    c 冒险前进!不做备份而让数据库接着跑 直等到下一个备份周期再做备份 这是在赌数据库在下一个备份周期到来之前不会有需要恢复的错误发生     注意:冒险前进的选择 如果发生错误而需要数据库恢复 则最多只能恢复到出问题archive log 之前的操作现场 从另一个角度讲 archive log(s) 出现问题时 数据库若不需要恢复则其本身并没有任何问题      Oracle逻辑结构故障的处理方法     逻辑结构的故障一般指由于人为的误操作而导致重要数据丢失的情况 在这种情况下数据库物理结构是完整的也是一致的 对于这种情况采取对原来数据库的全恢复是不合适的 我们一般采用三种方法来恢复用户数据      采用exp/imp工具来恢复用户数据     如果丢失的数据存在一个以前用exp命令的备份 则可以才用这种方式      在数据库内创建一个临时用户   svrmgrl>create user test_user identified by test;  svrmgrl>grant connect resource to test_user;     从以前exp命令备份的文件中把丢失数据的表按照用户方式倒入测试用户   $imp system/manager file=export_file_name tables=(lost_data_table_name…) fromuser=lost_data_table_owner touser=test_user constraint=n;     用相应的DML语句将丢失的数据从测试用户恢复到原用户      将测试用户删除   svrmgrl>drop user test_user cascede;     采用logminer来恢复用户数据     Logminer是oracle提供的一个日志分析工具 它可以根据数据字典对在线联机日志 归档日志进行分析 从而可以获得数据库的各种DML操作的历史记录以及各种DML操作的回退信息 根据这些用户就可以将由于误操作而丢失的数据重新加入数据库内      确认数据库的utl_file_dir参数已经设置 如果没有则需要把这个参数加入oracle的初始化参数文件 然后重新启动数据库 下面例子中假设utl_file_dir= /opt/oracle/db      创建logminer所需要的数据字典信息 假设生成的数据字典文本文件为dict ora   svrmgrl>execute dbms_logmnr_d build(dictionary_filename=> dict ora dictionary_location=> /opt/oracle/db );     确定所需要分析的日志或者归档日志的范围 这可以根据用户误操作的时间来确定大概的日志范围 假设用户误操作时可能的日志文件为/opt/oracle/db /oradata/ORCL/redo log和归档日志 /opt/oracle/arch/orcl/orclarc_ _ ora      创建要分析的日志文件列表 按日志文件的先后顺序依次加入   svrmgrl>execute dbms_logmnr add_logfile(logfilename=> /opt/oracle/arch/orcl/orclarc_ _ ora options=>dbms_logmnr NEW);  svrmgrl> execute dbms_logmnr add_logfile(logfilename=> /opt/oracle/db /oradata/ORCL/redo log options=>dbms_logmnr ADDFILE);     开始日志分析 假设需要分析的时间在 : : 和 : : 之间   svrmgrl>execute dbms_logmnr start_logmnr(dictfilename=> /opt/oracle/db /dict ora starttime=>to_date( : : YYYY MM DD HH:MI:SS ) endtime=>to_date(to_date( : : YYYY MM DD HH:MI:SS ));     获取分析结果   svrmgrl>select operation sql_redo sql_undo from v$logmnr_contents;     根据分析结果修复数据      结束logmnr:  svrmgrl>dbms_logmnr end_logmnr;     用适当的方法对原数据库进行数据库全备份      利用备份恢复用户数据     采用这种方法时并不是在原数据库进行恢复 而是利用数据库备份在新的机器上重新建立一个新的数据库 通过备份恢复在新机器上将数据库恢复到用户误操作前 这样就可以获得丢失的数据将其恢复到原数据库      在新的机器上安装数据库软件      对于采用带库备份的现场 需要在新的数据库服务器上安装调试相应的备份管软件      根据用户误操作的时间点进行基于时间点的数据库恢复操作 对于没有采用带库备份的现场 可以选取用户误操作前最近的备份磁带进行恢复 对于才用带库备份的点可以通过基于时间恢复点恢复的rman脚本来进行恢复      重新打开数据库   svrmgrl>alter database open resetlogs;     从新的数据库中获取丢失的用户数据 通过DML操作将其恢复到原数据库中      用适当的方法对原数据库进行数据库全备份 cha138/Article/program/Oracle/201311/17117

相关参考

规程要求,根据机组的具体情况,制定分散控制系统在各种故障情况下时的紧急处理措施,至少应包括()

规程要求,根据机?ahref='http://www.baiven.com/baike/222/323577.html'target='_blank'style='color:#136ec2'>榈木咛

知识大全 工作中遇到的oracle故障分析和处理一例

  案例类别VAS网络系统类型CMODE系统版本硬件SUN软件所有版本案例标题CMODE放号中的数据库出现LOCK的处理方法故障现象启动sam_cmode进程不能正常处理工单故障描述启动以sam_cm

知识大全 Oracle重做日志丢失的故障处理

Oracle重做日志丢失的故障处理  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  Oracle重

知识大全 Linux系统常见紧急情况的处理方法

Linux系统常见紧急情况的处理方法  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  .使用急救盘

高炉紧急停电应如何处理?

  输电线路故障,雷雨电击等原因造成紧急停电时,立即查看风口有没有风,冷却器有没有水。若因断电而使风机停风,应按风机突然停风处理;若引起紧急停水,立即按紧急停水处理;若停风和停水两者同时出现,则先按风

高炉紧急停电应如何处理?

  输电线路故障,雷雨电击等原因造成紧急停电时,立即查看风口有没有风,冷却器有没有水。若因断电而使风机停风,应按风机突然停风处理;若引起紧急停水,立即按紧急停水处理;若停风和停水两者同时出现,则先按风

如何防止和处理大灌渣?

  高炉出现大灌渣的原因一般为:连续多次渣铁出不净,风口和吹管烧穿紧急放风,风机或送风系统故障而突然停风,以及处理悬料和管道等。大灌渣有时不仅将直吹管灌死,严重的还会灌到弯头和鹅颈管。灌后处理需要较长

如何防止和处理大灌渣?

  高炉出现大灌渣的原因一般为:连续多次渣铁出不净,风口和吹管烧穿紧急放风,风机或送风系统故障而突然停风,以及处理悬料和管道等。大灌渣有时不仅将直吹管灌死,严重的还会灌到弯头和鹅颈管。灌后处理需要较长

什么是正常停炉?故障停炉?紧急停炉?

  锅炉停炉分正常停炉、故障停炉和紧急停炉三种,这三种停炉是有区别的。  锅炉计划内大、小修停炉和由于总负荷降低为了避免大多数锅炉低负荷运行,而将其中一台锅炉停下转入备用,均属于正常停炉。  锅炉有缺

什么是正常停炉?故障停炉?紧急停炉?

  锅炉停炉分正常停炉、故障停炉和紧急停炉三种,这三种停炉是有区别的。  锅炉计划内大、小修停炉和由于总负荷降低为了避免大多数锅炉低负荷运行,而将其中一台锅炉停下转入备用,均属于正常停炉。  锅炉有缺