En ocasiones podemos recibir mensajes en nuestro log /var/log/messages sobre un bug en el kernel y que lo podamos recibir también en nuestras terminales. Tal vez te puede sacar de tus casillas y rezar a los 4 vientos porque pienses que se dañó tu Sistema Operativo, los mensajes que podríamos estar recibiendo como el que mostraremos:
Sep 03 04:47:56 mexhplwx kernel: BUG: soft lockup - CPU#11 stuck for 64s! [java:2029]
Sep 03 04:47:56 mexhplwx kernel: Modules linked in: autofs4 ip6t_REJECT nf_conntrack_ipv6 nf_defrag_ipv6 xt_state nf_conntrack ip6table_filter ip6_tables ipv6 vsock(U) ppdev parport_pc parport sg microcode serio_raw vmware_balloon i2c_piix4 i2c_core vmci(U) shpchp ext4 jbd2 mbcache sd_mod crc_t10dif vmxnet3 vmw_pvscsi sr_mod cdrom pata_acpi ata_generic ata_piix dm_mirror dm_region_hash dm_log dm_mod [last unloaded: mperf]
Sept 03 04:47:56 mexhplwx kernel: CPU 11
Sep 03 04:47:56 mexhplwx kernel: Modules linked in: autofs4 ip6t_REJECT nf_conntrack_ipv6 nf_defrag_ipv6 xt_state nf_conntrack ip6table_filter ip6_tables ipv6 vsock(U) ppdev parport_pc parport sg microcode serio_raw vmware_balloon i2c_piix4 i2c_core vmci(U) shpchp ext4 jbd2 mbcache sd_mod crc_t10dif vmxnet3 vmw_pvscsi sr_mod cdrom pata_acpi ata_generic ata_piix dm_mirror dm_regio
Estos mensajes nos pueden indicar que nuestro S.O. ha sobrepasado el límite de tiempo del softlockup y puede deberse a que el sistema esté ocupado con I/O.
Vamos a ver la solución, ya que puede ser que el mensaje lo estemos recibiendo y en nuestras métricas de CPU tengamos un idle muy light.
Para versiones anteriores de RHEL 6.1, debemos poner más de 10 segundos en el chequeo:
# echo 120 > /proc/sys/kernel/softlockup_thresh
Para versiones mayor de RHEL 6.1, lo debemos de configurar en:
Modificar el parámetro kernel.watchdog_thresh
Si tienes dudas, puedes dejar tu mensaje para orientarte, de igual manera si tienes una empresa y necesitas que administren tus servidores puedes enviar un correo a asesoria@cosvernauta.com
Bytes.