您的位置:时时app平台注册网站 > 彩世界网址 > AIX情状下 怎样在服务器在线形式会诊硬件故障

AIX情状下 怎样在服务器在线形式会诊硬件故障

2019-10-12 09:26

系统硬件故障分析可以使用diag命令进行分析和判断。

#sysdumpdev -CP

**

Sat查看系统活动状态信息。

注意

.2.1.5 POWER CPU芯片封装 90
2.1.6 AIX的历史 90
2.2 CPU特性 92
2.2.1 32/64位问题 92
2.2.2 查看CPU类型和主频 96
2.2.3 HMT,SMT,HT技术 96
2.3 进程、线程 98
2.3.1 进程、线程、优先级概念 99
2.3.2 查看系统进程情况 104
2.3.3 zombie(僵尸进程) 104
2.3.4 进程定时执行控制 105
2.4 SMP和群集 106
2.4.1 SMP对称多处理器的概念 106
2.4.2 Cluster群集技术 107
2.5 DUMP和DUMP分析 108
2.5.1 DUMP的概念 108
2.5.2 估计DUMP大小 109
2.5.3 系统DUMP码分析 111
2.5.4 CORE DUMP 118
2.5.5 MINI DUMP 119
2.6 性能优化的概念 120
2.7 Simulation,Virtualization,虚拟化技术、分区 121
2.7.1 虚拟化的第一个关键词:资源共享和隔离 121
2.7.2 虚拟化的第二个关键词:分配方式和颗粒度 122
2.7.3 虚拟化的第三个关键词:上下层之间的相关性 123
第 3 章 第二日上帝说:“储存与计算要分开。”便产生了内存 135
3.1 内存芯片 136
3.2 Paging Space,交换区 138
3.2.1 交换区多大比较合适 139
3.2.2 分配交换区的建议规则 139
3.2.3 如何缩小默认的交换区(hd6) 140
3.2.4 交换区不断增长,直至100%怎么办 141
3.2.5 交换区分配策略 142
3.2.6 交换区分配问题解释 142
3.3 内存管理 143
3.3.1 AIX下内存种类 143
3.3.2 AIX内存分配、回收过程 145
3.3.3 系统剩余内存的思考 148
3.3.4 内存泄漏 151
3.3.5 vmo内存控制 155
3.4 内存优化 159
第 4 章 第三日上帝说:“数据要永不丢失。”因此创造了磁盘 161
4.1 存储产品和技术 162
4.1.1 内置存储 162
4.1.2 外置存储 163
4.1.3 磁带 163
4.1.4 光盘 165
4.1.5 软盘 166
4.1.6 硬盘 166
4.1.7 DAS(Directory Access Storage,直连存储) 167
4.1.8 SAN(Storage Area Network,存储网络) 167
4.1.9 NAS(Network Attached Storage,网络存储) 169
4.1.10 JBOD 169
4.1.11 RAID磁盘阵列 170
4.1.12 RAID技术 170
4.1.13 LUN 174
4.1.14 智能存储 175
4.1.15 磁带库 175
4.2 存储淘宝 178
4.2.1 硬盘资源 179
4.2.2 SCSI设备资源和SCSI技术 182
4.2.3 CD-ROM 188
4.2.4 DVD-RAM 189
4.3 存储管理 190
4.3.1 LVM 190
4.3.2 VGDA(Volume Group Descriptor Area) 192
4.3.3 VGSA(Volume Group Status Area) 194
4.3.4 Big VG, Scalable VG 194
4.3.5 Physical Volume(PV)控制 195
4.3.6 Volume Group(VG):卷组参数 195
4.3.7 Logical Volume(LV):逻辑卷参数 197
4.3.8 File System:文件系统参数 198
4.3.9 JFS2文件系统 199
4.3.10 文件、文件系统信息 200
4.3.11 特殊的卷组rootvg 202
4.3.12 磁盘引导boot 203
4.3.13 系统修复、单用户模式 205
4.3.14 LVM命令 206
4.3.15 AIX 5L文件系统限制 208
4.3.16 系统备份 209
4.4 存储的层次 209
第 5 章 第四日上帝说:“你应与我沟通。”终端由此产生 212
5.1 小型机操作界面 213
5.1.1 字符终端仿真 214
5.1.2 字符终端的特殊功能 215
5.1.3 X-Windows终端仿真 218
5.1.4 终端操作技巧 219
5.2 小型机SMS操作 223
5.3 小型机HMC操作 225
5.3.1 HMC网络连接 226
5.3.2 HMC基本功能操作 228
5.3.3 DLpar动态分区管理 245
5.4 小型机用户管理 251
5.4.1 用户管理 251
5.4.2 用户组管理 253
5.5 小型机提示信息 254
5.5.1 位置代码Location Code概念 254
5.5.2 物理位置码 256
5.5.3 Error Log(错误日志) 258
5.5.4 故障码 259
5.6 Korn Shell操作 265
5.6.1 命令、I/O重定向和管道 265
5.6.2 Shell变量 265
5.6.3 Shell常用命令和句法 270
5.6.4 日常管理用Shell实例 278
第 6 章 第五日上帝说:“大家要联结在一起。”网络时代降临 290
6.1 小型机接口卡(Interface Card) 291
6.1.1 接口卡物理标准——PCI插槽 293
6.1.2 接口卡物理标准——网络GBIC接口 296
6.1.3 接口卡物理标准——FC接口设备协议的标准 296
6.2 设备管理 298
6.2.1 设备的三种状态 298
6.2.2 设备类型 299
6.2.3 设备管理相关命令 300
6.3 网络技术 301
6.3.1 配置IP地址和主机名 301
6.3.2 配置网卡 303
6.3.3 路由管理 303
6.3.4 网络工具 309
6.3.5 网络连接状态 311
6.3.6 no命令详解 312
6.4 资源控制 318
6.5 网络技术应用 322
6.5.1 lsof使用介绍 322
6.5.2 网络时钟同步 328
6.5.3 NIM简介 331
第 7 章 第六日上帝说:“这里将孳生生命。”AIX被赋予那个奇妙的黑盒子,小型机诞生 344
7.1 启动、安装操作系统 345
7.1.1 检查设备及系统配置信息 345
7.1.2 光盘启动(引导系统) 350
7.1.3 重新启动、登录 355
7.1.4 修改必要系统参数 359
7.2 软件安装 360
7.2.1 安装操作系统组件 360
7.2.2 安装AIX标准安装格式文件 362
7.2.3 安装第三方软件 363
7.2.4 补丁管理 363
第 8 章 第七日上帝休息了,我们却刚刚醒来 365
8.1 如何学习小型机技术 367
8.1.1 如何学习 367
8.1.2 如何提问 371
8.1.3 如何查找 376
8.2 捡拾敲门砖,AIX认证考试 379
8.2.1 AIX, pSeries相关认证 380
8.2.2 认证考试要点 381
8.2.3 如何准备认证考试 414
8.2.4 参考题型分析 420
8.2.5 如何参加认证考试 439
8.2.6 认证考试注意事项 440
8.3 如何发展 441
8.3.1 我是否希望成为系统工程师 442
8.3.2 我怎样得到第一份系统工程师工作 445
8.3.3 我刚得到第一份工作!下一步该怎么做 449
8.3.4 如何从中级水平转变为高级系统工程师 453
8.4 小型机的用途和技术工作 455
8.4.1 小型机用途 455
8.4.2 小型机相关技术工作需求 456
8.4.3 系统工程师工作范例——变更管理 457
第 9 章 寻找金钥匙,开启小型机功能 462
9.1 应用软件及系统程序管理 463
9.1.1 Acrobat Reader 463
9.1.2 Alternate Disk Install 463
9.1.3 C语言编译环境 467
9.1.4 制作CD系统备份 476
9.1.5 制作可以用installp安装的文件 478
9.1.6 从mksysb中恢复特定的文件 478
9.1.7 Netscape Browser 478
9.1.8 Java Developer Kit 480
9.2 存储管理 480
9.2.1 AIO 480
9.2.2 能在AIX上播放audio CD吗 482
9.2.3 如何直接备份到另一台机器的磁带机 482
9.2.4 如何在AIX和DOS间公用软盘或USB盘 482
9.2.5 如何重新组织逻辑磁盘的顺序 482
9.2.6 如何创建可以容纳超过2GB的文件的文件系统 483
9.2.7 如何用fsck检查根文件系统或者其他几个重要的文件系统 483
9.2.8 如何删除一个不存在的物理磁盘(Ghost Disk) 483
9.2.9 Hot Spare Disk热备份磁盘 484
9.2.10 Hot Spot Management热点盘管理 484
9.2.11 如何通过inode号得到文件名 485
9.2.12 iSCSI 485
9.2.13 逻辑卷头开始的4KB有什么用途(LVCB) 486
9.2.14 如何创建固定大小的文件(用于Log) 487
9.2.15 RAM Disk创建内存磁盘 487
9.2.16 在根目录(/)下执行了 rm *,如何恢复系统 487
9.2.17 如何恢复错误的root VG, LV定义 488
9.2.18 Snapshot存储快照 488
9.2.19 Split Mirror镜像分离 490
9.2.20 如何实现一盘磁带多次使用而不删除前面的数据 491
9.2.21 如果VG被锁住怎么办 492
9.2.22 每个VG中对物理分区的限制是多少 492
9.2.23 为什么无法将一个磁盘添加到VG中 494
9.3 网络管理 494
9.3.1 AIX出现蓝屏怎么办 494
9.3.2 Dead Gateway Detection(DGD)故障网关检测 495
9.3.3 如何通过网络复制目录下的全部文件,又保留用户信息 495
9.3.4 如何通过网络复制磁带 496
9.3.5 DNS域名服务 496
9.3.6 Ethernet Channel 505
9.3.7 如何能将用户的ftp访问操作记录到文件 506
9.3.8 FTP, Anonymous FTP匿名FTP 506
9.3.9 HTTP Web服务 512
9.3.10 IP Sec 513
9.3.11 Network Interface Backup网卡备份 518
9.3.12 Mail 519
9.3.13 当系统的mail经常涨满/var目录怎么办 520
9.3.14 SAMBA,提供Windows服务 520
9.3.15 TCP Wrapper 屏蔽IP地址 527
9.3.16 TFTP Server 530
9.3.17 SSH 530
9.3.18 VIPA 531
9.4 安全管理 532
9.4.1 AIX的log文件都放在什么地方 532
9.4.2 服务安全检查内容 533
9.4.3 网络服务安全分析 534
9.4.4 安全相关网络no参数 540
9.4.5 password只限于8个字符吗 541
9.4.6 PAM(Plugable Authorize Module)插入式认证模块 541
9.4.7 为什么/etc/profile不起作用 543
9.4.8 如何从另外一台计算机复制用户和组信息 543
9.4.9 如何更改类似每用户可运行的最大进程数之类的选项 543
9.4.10 如何缩小/var/adm/wtmp的大小 544
9.5 Console, Shell操作 544
9.5.1 系统缺少一个命令,如何确定需要安装哪个软件包 544
9.5.2 如何看到主控台的信息 545
9.5.3 如何在系统启动时同时启动本地的daemon程序 545
9.5.4 解决目录下文件过多无法删除、显示的问题 545
9.5.5 如果键盘连线被断开后再接回系统,如何使其生效 546
9.5.6 Kill,如何杀掉一个死进程 546
9.5.7 为什么会有getty spawning too rapidly提示 546
9.5.8 如何把用绝对路径tar的文件恢复到相对路径 546
9.5.9 如何删除一个挂起的tty端口 547
附录 A 548

图片 1

#sysdumpdev -cP

内容简介
读者能通过本书自己揭开小型机的神秘面纱,了解一款著名的小型机——IBM pSeries产品的硬件结构,掌握基本的概念和管理技能,甚至自己“DIY”出一台廉价的pSeries小型机(服务器);另一方面,也能够了解与小型机相关的工作和技能需求,规划自己的职业发展。本书分为9章,分别讲述了小型机的概念、历史,CPU、进程、线程管理,内存相关技术,存储、逻辑卷管理相关技术,终端管理和通过HMC对小型机进行分区管理的技术,网络和接口卡相关的技术,AIX软件的安装过程和基本配置,如何学习小型机、如何准备认证考试、小型机相关职业的信息,以及AIX/pSeries使用中的一些小技巧。
本书适合的读者:对IT技术感兴趣、期望毕业之后能够从事IT工作的学生;刚刚进入IT领域,正在寻找发展目标的“菜鸟”;已经具备了一定的IT技能,但在工作、学习中遇到瓶颈的技术人员。作者希望能通过本书与专家们互相交流心得,共同加深对IT技术的领悟。

4)图形设备

 

畅销书升级版!
国内第一本全面介绍IBM小型机技术和职业发展的参考书

#diag —S

CORE DUMP的生成过程

目录
第 1 章 认识IBM小型机 1
1.1 小型机和小型机的历史 2
1.1.1 RISC、CISC和CPU生产技术 6
1.1.2 曾经繁星闪烁 10
1.2 蓝色巨人和她的竞争对手 19
1.2.1 IBM eServer pSeries发展历史 22
1.2.2 竞争对手 29
1.2.3 IBM eServer pSeries 30
1.2.4 最后的敌人 32
1.3 拥有你自己的IBM小型机 37
1.3.1 攒小型机的原材料 38
1.3.2 攒机必备工具 41
1.3.3 攒机必备软件 45
1.3.4 IBM相关基础概念 52
第 2 章 第一日上帝说:“我要计算”便有了计算机 79
2.1 POWER家族 81
2.1.1 POWER系列 81
2.1.2 Star系列 86
2.1.3 Power PC系列 87
2.1.4 IBM的芯片制造专利 89

作为辅助。定期运行检查服务器性能的相关工具和命令,有助于掌握服务器状态,预测故障点,相关命令包括:

            . 应用进程 core dump 分析 |outline

 

在所有资源上运行诊断。

参考至:《走进IBM小型机世界》Orian著

图片 2

svm on 命令用来查看系统当前的内存的具体使用。

作为一般客户通常只需要收集DUMP信息,并反馈给IBM工程师即可。当发生系统DUMP时,机器将会被宕下来。可能的原因包括:系统在进行内核操作时发生了未知的意外或者不能对其进行正常处理,都会引起DUMP。也可以由系统管理员发出命令,强制系统DUMP。
当系统进行DUMP时,DUMP管理设施自动将内核相关的数据(kernel segment0及其他由内核或者内核扩展程序记录在主DUMP表中的内存块)复制到主DUMP设备。可以把DUMP理解为系统当时的一个快照,供以后分析,分析DUMP可以在其他机器上进行,但需要复制一份此机器的内核程序,即unix_mp或unix_mp64.没有对应于DUMP的内核程序是午饭进行DUMP分析的。
DUMP的生成过程

**走入IBM小型机世界

查看系统I/O状态。分析CPU对各端口的服务占比,了解硬盘swap空间和内存的数据比例关系。

           

样章免费试读: 

3、查看系统的错误日志

#sysdumpdev -KP

基本信息
作者: Orain(刘浩林)   
出版社:电子工业出版社
ISBN:9787121100987
上架时间:2010-3-24
出版日期:2010 年2月
开本:16开
页码:582
版次:2-1

no 命令用来修改内核参数。调整系统性能。

 

Svmon

           

Topas

关闭命令

5)SCSI设备

sysdump命令使用示例
创建DUMP设备

2、系统故障分析和判断

errpt报错E87EF1BE的解决方案

1、故障概述

图片 3

图片 4

将磁带设备 rmt0 临时指派为辅助转储设备:
#sysdumpdev  -s /dev/rmt0 
显示先前的转储的统计信息:
#sysdumpdev  -L 
永久地将主要转储设备的数据库对象更改到 /dev/newdisk1,输入:
#sysdumpdev  -P  -p /dev/newdisk1 
确定是否存在新的系统转储,输入:
#sysdumpdev  -z 
如果最近发生了系统转储,则会出现与下列相似的输出:
4537344 /dev/hd7
将远程转储文件 /var/adm/ras/systemdump(在主机 mercury 上)指派给主要转储设备,输入:
#sysdumpdev  -p mercury:/var/adm/ras/systemdump 
在主机名和文件名之间必须输入冒号 :。
指定系统崩溃后转储要复制到其上的目录(如果转储设备是 /dev/hd6),输入:
#sysdumpdev  -d /tmp/dump 
这会在系统崩溃后试图将转储从 /dev/hd6 复制到 /tmp/dump。如果在复制过程中出现了错误,那么系统继续引导,但是丢失了转储。
指定系统崩溃后转储所要复制其上的目录,如果转储设备是 /dev/hd6,输入:
#sysdumpdev  -D /tmp/dump
这会在崩溃后尝试将转储从 /dev/hd6 复制到 /tmp/dump 目录。如果复制失败,那么会提示您一个菜单以允许手工将转储复制到某个外部介质。

Vmstat

由于DUMP文件较为复杂而且一般都交给IBM工程师进行分析,在次本文不做讨论,下文主要探讨DUMP文件的管理。

当系统发生软硬件故障导致宕机时,系统将搜集故障发生时系统的内存和处理器状态等信息,产生DUMP文件,并且在液晶屏上显示888开始的代码。记录第二段开始的故障码,并分析DUMP状态码有助于分析故障原因,找到问题所在。

图片 5

2)I/O设备

2.当系统重启的时候,如果设置了force copy flag为true,可以有提示让你将dump复制到外置介质,例如磁带。这样磁盘目录不够的时候,也有机会保留(往往DUMP设备与系统交换分区共用同一逻辑卷,而系统启动后,交换区将被覆盖)一份系统DUMP。

Iostat

关闭命令

1)基本系统

3.如果想允许DUMP文件进行压缩,则使用下列命令

6)存储设备

原文:

服务器技术已经发展几十年,但随着互联网信息技术的发展。云技术和移动平台成为新的技术标准。为了使终端更便捷,客户端会采用手持式移动设备和浏览器,并要求相关的数据和程序须保留在“云”端。随着云技术和移动平台的发展,服务器的数量和规模必将成几何级数的增长。故障和问题也会成倍增长。但和在个人使用的情况不同,网络化的服务器由于同时支持众多的操作者。运行不同的网络应用程序。管理众多的本地和远程设备。其设备的故障诊断就相对复杂。

DUMP文件概述 

4、DUMP

 在进程运行出现异常行为时,例如无效地址访问、浮点异常、指令异常等,将导致系统转入内核态进行异常处理(即中断处理),向相应的进程发出特定信号例如 SIGSEGV、SIGFPE、SIGILL 等。如果应用进程注册了相应信号的处理函数(例如可通过 sigaction 注册信号处理函数),则调用相应处理函数进行处理(应用程序可以选择记录信息后生成 core dump 并退出);否则将采取默认动作,例如 SIGSEGV 的默认动作是生成 core dump 并退出程序。
进程 coredump 的时候,操作系统会将进程终止并释放其占用的资源,正常情况下,应用进程 coredump 不会对系统本身的运行造成危害。当然如果系统中存在与此进程相关的其他进程,则这些进程会受到影响,至于后果则视其对此异常的具体处理而定。
 由于相关指令已经包含在可执行文件中,core 文件一般只包含进程异常时相关的内存信息。其格式可参考 /usr/include/sys/core.h 或者 AIX 帮助文档的“Files Reference”章节。我们一般需要结合 core 文件以及可执行程序,来分析问题所在
 注:由于进程信号处理本质上是异步的,应用进程注册的信号处理函数中使用的例程需要保证是异步信号安全的,例如不能使用诸如 pthread_ 开头的例程。 
系统 dump 生成过程 
系统异常 dump 的具体过程与应用进程类似,但由于更接近底层,为了避免问题所在的资源(例如文件系统)正好包含在生成 dump 需要使用的资源中,造成 dump 无法生成,操作系统一般会用最简单的方式来生成 dump。例如系统内存小于 4G 的情况下,一般直接将 dump 生成在 pagingspace 中;大于 4G 时,会建专门的 lg_dumplv 逻辑卷(裸设备),默认的dump设备/dev/hd6,次设备是/dev/sysdumpnull保存 dump 信息。在系统重启的时候,如果设置的 DUMP 转存目录(文件系统中的目录)有足够空间,它将会转存成一个文件系统文件,缺省情况下,是 /var/adm/ras/ 下的 vmcore* 这样的文件。
下面是常见的转储设备大小规则
当服务器的内存大于4GB时,在安装AIX时,就会为系统 dump 创建一专用区域,该逻辑卷名就是 lg_dumplv. 其缺省大小是按以下规则分配的:
4GB < = 服务器的内存 〈 12GB lg_dump 的大小为 1GB
12GB < = 服务器的内存 〈 24GB lg_dump 的大小为 2GB
24GB < = 服务器的内存 〈 48GB lg_dump 的大小为 3GB
48GB < = 服务器的内存 lg_dump 的大小为 4GB 
系统 dump 一般可以通过升级微码、提高系统补丁级别、升级驱动等方式解决。
环境变量设置 
可以通过 /etc/security/limits 文件对各用户的基本配置参数包括 core 大小进行限制。或者通过 ulimit 更改当前环境下的 core 大小限制。
默认情况下,应用进程生成 core dump 时都使用文件名 core。为了避免同一工作目录下的进程 core 相互覆盖,可以定义环境变量 CORE_NAMING=true,然后启动进程,这样将生成名为 core.pid.ddhhmmss 的文件。可以使用 file core 命令查看 core 是哪个进程产生的。
默认情况下,应用进程 dump 时会包含所有的共享内存,如果 dump 时想排除共享内存内容,可以在启动进程之前设置环境变量 CORE_NOSHM=true.
系统有一个参数 fullcore 用于控制是否在程序 coredump 时生成完整的 core。为避免信息丢失,建议打开 fullcore。可以使用 lsattr –El sys0 查询是否将 fullcore 打开,使用 chdev -l sys0 -a fullcore=true 将 fullcore 状态更改为打开。如果想让系统DUMP后自动重新启动,(对于远程管理员比较有用,否则管理员必须到现场按开关重新启动计算机,可以执行 lsattr –El sys0 查看autorestart是否为true,使用 chdev -l sys0 -a autorestart=true 将 autorestart状态更改为打开。两者都可以通过smit chgsys的smit菜单来修改

UNIX本身是为复杂网络化环境设计的操作系统,而AIX操作系统是最大的系统集成商IBM开发的第二代UNIX,具有性能完善,使用方便,扩充性强,适合企业关键业务等特点,所以本文实例均在AIX环境下实现。

将逻辑卷 hd7 临时指派为主要转储设备:
#sysdumpdev  -p /dev/hd7

服务器的在线模式故障是指服务器发生了一般性错误。这些错误虽然不至于系统崩溃。但影响系统的正常运行,影响数据的健壮性,并有进一步扩大危害的可能。系统的问题和故障应该及早发现。并及时进行处理和解决,避免进一步的危害,引起严重后果。及早的预判。及早的发现。及早的排查是故障诊断的关键。

为了增强故障分析能力,IBM的服务器增加了对设备故障当前环境的保存功能,就是保存一份设备故障时的内存、CPU寄存器、IO等设备的数据和状态信息,如果系统并没有停住,只是某个程序死掉,会产生CORE DUMP,在当前目录下产生一个CORE文件。而如果操作系统死掉,则产生System DUMP或者System Crash,通常会引起系统停机。DUMP的记录如下图所示。

Topas可以监控系统内存,CPU,I/O端口,swap空间的情况

估计需要的转储设备大小:
#sysdumpdev  -e 或者 smit dump_estimate

8)多媒体设备

 

Sar

-e 估计当前运行的系统的转储大小(以字节表示)。 如果压缩转储,那么所显示的大小是压缩之后大小的估计值。
-i 表示从系统函数调用 sysdumpdev 命令。 只有系统实用程序才使用该标志。如果不是自动 IBM 函数的函数已经修改了有效值,那么 -i 标志就不会作请求的更改;也就是说,-i 标志不会覆盖先前的更改。
-I 重新设置先前更改的指示信息。指定 -I 标志后,用 -i 标志就允许更改。
-k 如果您的机器有钥匙方式开关,那么在用复位按钮或转储键控序列强制转储前,钥匙需要处于服务位置。这是缺省设置。
-K 如果您的机器有钥匙方式开关,那么钥匙处于正常位置时使用复位按钮或转储键序列将强制转储,或在没有钥匙方式开关的机器上也将强制转储。
注: 对于没有钥匙方式开关的机器, 不能用复位按钮强制转储,在钥匙开关没有设置了该值的机器上也不能转储。
-l 列出主要和辅助转储设备、复制目录和 forcecopy 属性的当前值。
-L 显示最近的系统转储的统计信息。 这包含最近的转储的日期和时间、所写的字节数和完成状态。 如果压缩了转储,那么该标志既显示转储的原始的未压缩的大小,也显示了转储的压缩后的大小。 压缩后的大小是实际写入转储设备的大小。
注:
显示的转储大小可能不会反映介质上的转储的精确大小。 由于磁盘和复制块大小,因此会有小小的差别。
-P 使 -p 或 -s 标志指定的转储设备成为永久设备。-P 标志 只能与 -p 或 -s 标志一起使用。
-p Device 暂时将主要转储设备更改为指定的设备。 该设备可以是逻辑卷或磁带设备。对于网络转储,该设备可以是主机名和路径名。
-q 禁止输出到标准输出的所有消息。如果该标志 与 -l 、-r 、-z 或 -L 标志一起使用,则会忽略 -q 命令。
-r Host : Path 释放服务器 Host 上远程转储文件所使用的空间。Path 指定转储文件的位置。
-s Device 暂时将辅助转储设备更改为指定的设备。 该设备可以是逻辑卷或磁带设备。对于网络转储,该设备可以是主机名和路径名。
-z 确定是否出现新的系统转储。如果出现,则会将包含转储大小(以字节表示)和转储设备名的字符串写到标准输出。如果不存在新的系统转储,则不返回任何东西。 在现有的系统转储上运行 sysdumpdev -z 命令后,就不认为转储是最新的了。

在系统运行时,一些系统错误会记录在errlog中,其中有些错误还会在终端上显示。检查错误日志可用以下命令

           

...

#mklv -y dumplv -t sysdump rootvg 10 

7)通信设备

打开命令

任何完好的系统它都不可能一点错误或故障都没有,网络服务器系统在运行时总是会或多或少的问题出现,虽然AIX系统具有自动诊断错误和故障的能力,但用户熟悉系统,并定期监视诊断系统的运行情况,方可避免不必要故障的发生。本文相关维护方法在IBM P520服务器,AIX 6.1操作系统下实现通过。

DUMP文件管理

6、结论

或者使用smitty -> System Environments-> Change / Show Characteristics of System Dump 菜单设置。

在系统管理员状态下运行命令#diag进行硬件诊断程序。检测主机内硬件存在的问题。

#sysdumpdev -l
primary              /dev/lg_dumplv           ##主DUMP设备 
secondary            /dev/sysdumpnull      ##次DUMP设备 
copy directory       /var/adm/ras            ##DUMP文件拷贝目录 
forced copy flag     TRUE                       ##是否进行提示将DUMP文件复制到外设 
always allow dump    FALSE                  ##总是进行DUMP 
dump compression     ON                     ##是否启用DUMP文件压缩 
type of dump         traditional 

5、日常检查服务器状态的项目及其相关命令

查看当前DUMP设备的配置信息

查看系统虚拟内存状态信息。

#sysdumpdev -kP

3)异步设备

E87EF1BE   0926082807 P O dumpcheck      The largest dump device is too small.
信息.断定为存放dump文件的lg_dumplv容量不够.一般推荐的 dump device 值大小为 sysdumpdev –e 估计值的 1.5 倍。
需要扩容.扩容步骤如下:
1.查看lg_dumplv大小的估计值
#sysdumpdev -e
0453-041 Estimated dump size in bytes: 1287651328 
即1.2G
2.现在lg_dumplv大小
#lslv lg_dumplv 
其中PP SIZE:        256 megabyte(s)
       PPs:            4
经计算,现在容量为1G.需要扩容0.2G

打开命令

3.查看lg_dumplv所在的vg的容量是否够用
 #lsvg rootvg 
  其中 PP SIZE:        256 megabyte(s)
         TOTAL PPs:      1092 (279552 megabytes)
         FREE PPs:       826 (211456 megabytes)
经计算,vg剩余容量为206.5G,因为根盘做了镜像.故,可用剩余容量为103G左右.因pp size为256m,故扩容2pps,即0.5G(其实扩1个pp也可以.2个放心点.)
4.扩容操作
 #extendlv lg_dumplv 2 
如果是PAGING空间的DUMP话,应该 #chps -s n hd6 (n为多少LP)
5.检查当前lg_dumplv的大小.
  #lslv lg_dumplv 
  其中 PP SIZE:        256 megabyte(s)
         PPs:            6
即,现在容量为1.5G.
6.使用dumpcheck命令查看,是否还出现errpt信息
  #/usr/lib/ras/dumpcheck
  #errpt
不出现,则为成功.

1.旧版本的 AIX “always allow dump”可能默认为关闭;为方便系统 crash 时问题定位,建议打开。当该选项设置为true时,当按下服务器reset按钮或者预先设定的DUMP键盘序列的时候系统会自动生成DUMP。

-c 指定不压缩转储。-c 标志只适用于 AIX 4.3.2 和以后的版本。
-C 指定所有将来的转储在其写入转储设备之前将其压缩。 -C 标志只适用于 AIX 4.3.2 和以后的版本。
-d Directory 指定系统引导时转储所复制到的目录 。 如果引导时复制失败,那么 -d 标志会忽略系统转储。
-D Directory 指定系统引导时转储所复制到的目录 。 如果引导时复制失败,那么使用 -D 标志允许您将转储复制到外部的介质。
注: 使用 -d Directory 或 -D Directory 标志时, 会检测下列的错误情况:
  • 目录 不存在。
  • 目录 不在本地日志文件系统里。
  • 目录 不在 rootvg 卷组中。

本文由时时app平台注册网站发布于彩世界网址,转载请注明出处:AIX情状下 怎样在服务器在线形式会诊硬件故障

关键词: