The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"сервер виснет panic: vm_fault"
Вариант для распечатки  
Пред. тема | След. тема 
Форумы OpenNET: Виртуальная конференция (Public)
Изначальное сообщение [ Отслеживать ]

"сервер виснет panic: vm_fault"  
Сообщение от HAN (??) on 14-Авг-08, 16:11 
Здравствуйте!
Переместил сервер на новое железо (точно не могу сейчас сказать) - материнка ASUS, Intel 2.6Гц 4х-ядерный, 8Гб памяти, 750Гб SATA Samsung, на него же была поставлена последняя FreeBSD 7.0
Там же были поставлены две сетевые Intel (emo/em1), бортовая сетевая была обнаружена системой только после патча выкачанного из интернета (она теперь age0), ядно пересобрано с технологиями SMP и APE, все 8Гб система видит
Первую неделю (пока переустанавливался софт/переносились данные) все было нормально, а вот пару дней назад пошли зависания, причем только ресет помогал. Ошибки на экране очень похожие и малоинформативные, вот например такие:

Panic: vm_fault: fault on nofault entry, addr: cb4eb000
cpuit = 1
Uptime: 12h7m6s
Phisical memory: 8182m
Dumping 421 MB

или так:

Panic: vm_fault: fault on nofault entry, addr: cb429000
cpuit = 1
Uptime: 1h43m42s
Phisical memory: 8182m
Dumping 330 MB:315

в системных логах ничего - процессы работают - потом останов, странно что никуда дамп не записывается - кажется на этом месте и идет зависание
задачи на сервере типовые - сайты, почта, фтп, нагрузка для такго железа уж совсем незначительная

Подскажите, пожалуйста, как вычислить причину возникновения таких зависаний?

Спасибо!

Высказать мнение | Ответить | Правка | Cообщить модератору

 Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "сервер виснет panic: vm_fault"  
Сообщение от suslic (??) on 14-Авг-08, 16:26 
>Panic: vm_fault: fault on nofault entry, addr: cb429000

ето похоже по моему мнению на глюки оперативки - попробуй memtest погонять пару часиков.

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

2. "сервер виснет panic: vm_fault"  
Сообщение от HAN (??) on 15-Авг-08, 14:24 
>>Panic: vm_fault: fault on nofault entry, addr: cb429000
>
>ето похоже по моему мнению на глюки оперативки - попробуй memtest погонять
>пару часиков.

вот более точная информация по аппаратуре:
материнка ASUS P5KC

hw.machine:i386
hw.model: Intel(R) Core(TM)2 Quad  CPU   Q9300  @ 2.50GHz
hw.ncpu:4hw.byteorder: 1234
hw.physmem: 3479306240
hw.usermem: 3323195392
hw.pagesize: 4096
hw.floatingpoint: 1
hw.machine_arch: i386
hw.realmem: 0
hw.aac.iosize_max: 65536
hw.amr.force_sg32: 0
hw.ata.wc: 1
hw.ata.atapi_dma: 1
hw.ata.ata_dma: 1
hw.bce.msi_enable: 1
hw.bce.tso_enable: 1
hw.bge.allow_asf: 0
hw.cardbus.cis_debug: 0
hw.cardbus.debug: 0
hw.firewire.hold_count: 3
hw.firewire.try_bmr: 1
hw.firewire.fwmem.speed: 2
hw.firewire.fwmem.eui64_lo: 0
hw.firewire.fwmem.eui64_hi: 0
hw.firewire.phydma_enable: 1
hw.firewire.nocyclemaster: 0
hw.firewire.fwe.rx_queue_len: 128
hw.firewire.fwe.tx_speed: 2
hw.firewire.fwe.stream_ch: 1
hw.firewire.fwip.rx_queue_len: 128
hw.firewire.sbp.tags: 0
hw.firewire.sbp.use_doorbell: 0
hw.firewire.sbp.scan_delay: 500
hw.firewire.sbp.login_delay: 1000
hw.firewire.sbp.exclusive_login: 1
hw.firewire.sbp.max_speed: 2
hw.firewire.sbp.auto_login: 1
hw.mfi.event_class: 0
hw.mfi.event_locale: 65535
hw.pccard.cis_debug: 0
hw.pccard.debug: 0
hw.cbb.debug: 0
hw.cbb.start_32_io: 4096
hw.cbb.start_16_io: 256
hw.cbb.start_memory: 2281701376
hw.pcic.pd6722_vsense: 1
hw.pcic.intr_mask: 57016
hw.pci.honor_msi_blacklist: 1
hw.pci.enable_msix: 1
hw.pci.enable_msi: 1
hw.pci.do_power_resume: 1
hw.pci.do_power_nodriver: 0
hw.pci.enable_io_modes: 1
hw.pci.host_mem_start: 2147483648
hw.pci.irq_override_mask: 57080
hw.syscons.kbd_debug: 1
hw.syscons.kbd_reboot: 1
hw.syscons.bell: 1
hw.syscons.saver.keybonly: 1
hw.syscons.sc_no_suspend_vtswitch: 0
hw.intr_storm_threshold: 1000
hw.availpages: 1898016
hw.bus.devctl_disable: 0
hw.psm.tap_timeout: 125000
hw.psm.tap_threshold: 25
hw.kbd.keymap_restrict_change: 0
hw.busdma.total_bpages: 1034
hw.busdma.zone0.total_bpages: 513
hw.busdma.zone0.free_bpages: 513
hw.busdma.zone0.reserved_bpages: 0
hw.busdma.zone0.active_bpages: 0
hw.busdma.zone0.total_bounced: 0
hw.busdma.zone0.total_deferred: 0
hw.busdma.zone0.lowaddr: 0xfffffffffffffff
hw.busdma.zone0.alignment: 2
hw.busdma.zone0.boundary: 65536
hw.busdma.zone1.total_bpages: 517
hw.busdma.zone1.free_bpages: 517
hw.busdma.zone1.reserved_bpages: 0
hw.busdma.zone1.active_bpages: 0
hw.busdma.zone1.total_bounced: 0
hw.busdma.zone1.total_deferred: 0
hw.busdma.zone1.lowaddr: 0xffffffff
hw.busdma.zone1.alignment: 2
hw.busdma.zone1.boundary: 65536
hw.busdma.zone2.total_bpages: 4
hw.busdma.zone2.free_bpages: 4
hw.busdma.zone2.reserved_bpages: 0
hw.busdma.zone2.active_bpages: 0
hw.busdma.zone2.total_bounced: 0
hw.busdma.zone2.total_deferred: 0
hw.busdma.zone2.lowaddr: 0xffffffff
hw.busdma.zone2.alignment: 1024
hw.busdma.zone2.boundary: 0
hw.busdma.zone3.total_bpages: 0
hw.busdma.zone3.free_bpages: 0
hw.busdma.zone3.reserved_bpages: 0
hw.busdma.zone3.active_bpages: 0
hw.busdma.zone3.total_bounced: 0
hw.busdma.zone3.total_deferred: 0
hw.busdma.zone3.lowaddr: 0xffffffff
hw.busdma.zone3.alignment: 2048
hw.busdma.zone3.boundary: 0
hw.clockrate: 2499
hw.via_feature_xcrypt: 0
hw.via_feature_rng: 0
hw.instruction_sse: 1
hw.apic.enable_extint: 0
hw.acpi.supported_sleep_state: S1 S3 S4 S5
hw.acpi.power_button_state: S5
hw.acpi.sleep_button_state: S1
hw.acpi.lid_switch_state: NONE
hw.acpi.standby_state: S1
hw.acpi.suspend_state: S3
hw.acpi.sleep_delay: 1
hw.acpi.s4bios: 0
hw.acpi.verbose: 0
hw.acpi.disable_on_reboot: 0
hw.acpi.handle_reboot: 0
hw.acpi.reset_video: 0
hw.acpi.cpu.cx_lowest: C1

запустил memtest 4000 10 и вот почти сразу такое пошло:
FAILURE: 0x0080a99d != 0x0280a99d at offset 0x04f00824.
FAILURE: 0x2890f7b6 != 0x2a90f7b6 at offset 0x04f24424.
  Compare XOR         : FAILURE: 0xb3d43da2 != 0xb1d43da2 at offset 0x0174e944.
FAILURE: 0xaed47dc5 != 0xacd47dc5 at offset 0x01818824.
FAILURE: 0xc314899c != 0xc114899c at offset 0x01818ce4.
FAILURE: 0xfe623431 != 0xfc623431 at offset 0x019f994c.
FAILURE: 0xee60d134 != 0xec60d134 at offset 0x01bbfa64.
FAILURE: 0xdf717451 != 0xdd717451 at offset 0x01bf3fa4.
FAILURE: 0xb4aa2301 != 0xb6aa2301 at offset 0x049f6024.
FAILURE: 0x75a27ec5 != 0x77a27ec5 at offset 0x04aebc24.
FAILURE: 0x5cb647b1 != 0x5eb647b1 at offset 0x04d26f0c.
FAILURE: 0x04ef3023 != 0x06ef3023 at offset 0x04d3d0e4.
FAILURE: 0xa4a21a82 != 0xa6a21a82 at offset 0x04f00824.
FAILURE: 0xccb2689b != 0xceb2689b at offset 0x04f24424.
  Compare SUB         : FAILURE: 0x809e0ccc != 0x749e0ccc at offset 0x0174e944.
FAILURE: 0xa5c9be1e != 0x99c9be1e at offset 0x01818824.
FAILURE: 0x4fe2d3a8 != 0x43e2d3a8 at offset 0x01818ce4.
FAILURE: 0x559316a6 != 0x499316a6 at offset 0x019f994c.
FAILURE: 0x3049c538 != 0x2449c538 at offset 0x01bbfa64.
FAILURE: 0x91c94766 != 0x85c94766 at offset 0x01bf3fa4.
FAILURE: 0xbd1d2786 != 0xc91d2786 at offset 0x049f6024.
FAILURE: 0x0b73441e != 0x1773441e at offset 0x04aebc24.
FAILURE: 0x5e4ecba6 != 0x6a4ecba6 at offset 0x04d26f0c.
FAILURE: 0x35ed5152 != 0x41ed5152 at offset 0x04d3d0e4.
FAILURE: 0x2a460a0c != 0x36460a0c at offset 0x04f00824.
FAILURE: 0xf420b822 != 0x0020b822 at offset 0x04f24424.
  Compare MUL         : FAILURE: 0x00000001 != 0x00000000 at offset 0x0174e944.
FAILURE: 0x00000001 != 0x00000000 at offset 0x04f24424.
  Compare DIV         : FAILURE: 0x66fb908b != 0x66fb908a at offset 0x0174e944.
FAILURE: 0x66fb908b != 0x66fb908a at offset 0x04f24424.
  Compare OR          : FAILURE: 0x42fb9001 != 0x42fb9000 at offset 0x0174e944.
FAILURE: 0x42fb9001 != 0x42fb9000 at offset 0x04f24424.
  Compare AND         :   Sequential Increment: ok
  Solid Bits          : ok
  Block Sequential    : setting 132

и сервер снова завис!
причем информация - память Kingston (!) 4 линейки по 2Гб
вот маркировка - KVR800D2N5/2G, 2GB PC2-6400 CL5 240-Pin DIMM, ASSY IN CHINA(2)
ну мало  верится что память такого бренда, хоть и из Китая может так глючить...

есть советы что нужно перейти на 64-битную FreeBSD

что скажете?

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

3. "сервер виснет panic: vm_fault"  
Сообщение от PavelR (??) on 15-Авг-08, 14:52 

>и сервер снова завис!
>причем информация - память Kingston (!) 4 линейки по 2Гб
>вот маркировка - KVR800D2N5/2G, 2GB PC2-6400 CL5 240-Pin DIMM, ASSY IN CHINA(2)
>
>ну мало  верится что память такого бренда, хоть и из Китая
>может так глючить...
>
>есть советы что нужно перейти на 64-битную FreeBSD
>
>что скажете?

вытаскивай планки по одной и снова гоняй тесты.

потом меняй найденную планку.


если не найдешь - переходи на 64бит

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

4. "сервер виснет panic: vm_fault"  
Сообщение от HAN (??) on 15-Авг-08, 17:27 
>[оверквотинг удален]
>>есть советы что нужно перейти на 64-битную FreeBSD
>>
>>что скажете?
>
>вытаскивай планки по одной и снова гоняй тесты.
>
>потом меняй найденную планку.
>
>
>если не найдешь - переходи на 64бит

в общем пока дела такие - там не все четире планки Kingston, а две! две другие NCR, пока я их убрал - и на оставшихся однотипных пока memtest уже на пятый круг пошел без ошибок, по-видимому разнотипные планки поставили, посмотрим дальше...

Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

5. "сервер виснет panic: vm_fault"  
Сообщение от suslic (ok) on 15-Авг-08, 17:35 
а рабочяя частота планок совпадает?
Высказать мнение | Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Индекс форумов | Темы | Пред. тема | След. тема
Оцените тред (1=ужас, 5=супер)? [ 1 | 2 | 3 | 4 | 5 ] [Рекомендовать для помещения в FAQ]




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру