OpenNET: статья - Восстановление IBM Informix Enterprise Replication сервера после краха

Восстановление IBM Informix Enterprise Replication сервера после краха


<< Предыдущая	ИНДЕКС	Поиск в статьях	src	Установить закладку	Перейти на закладку	Следующая >>

Ключевые слова:  (найти похожие документы)

From: Борис Державец <dba477@list.ru.>
Newsgroups: email
Date: Sun, 23 Jan 2005 20:29:37 +0500 (YEKT)
Subject: Восстановление IBM Informix Enterprise Replication сервера после краха

Online Disaster-Recovery процедура для IBM Informix Enterprise
Replication сервера 9.2 и выше, входящего в Update  Anywhere Enterprise
Replication

   Допустим,что g_cp ,g_fw ,g_tp ,g_sc  Enterprise Replication (ER) сервера,
входящие в Update Anywhere Enterprise Replication. Сервером СУБД являeтся
Informix Dynamic Server 9.2UC2 среда - AIX 4.3

server_xx - имя UNIX сервера  для  ER сервера g_xx ,соответственно
описанное в SQLHOSTS  файле на каждом ER сервере.

Предположим  ER сервер g_cp терпит крах (мы допускаем,что Informix Dynamic 
Server на хосте server_cp остался в режиме online,иначе первый "delete"
не нужен).

Удалим ER сервер g_cp из системы:

    informix@server_cp$ cdr delete server g_cp
    informix@server_tp$ cdr delete server g_cp - connect server_tp

Первая команда удаляет ER сервер и глобального каталога
на локальном хосте, вторая  удаляет его из всей системы.

Допустим  server_cp восстановлен и готов к синхронизации.
Определим g_cp как ER сервер в системе:

    informix@server_cp$ cdr def server  -connect  server_cp -I -S g_tp g_cp   \
          -A   $INFORMIXDIR/ats   -R $INFORMIXDIR/ris

-A определяет Aborted Transaction Spooling Directory;
-R определяет  Row Information Spooling Directory

Определим репликации на g_cp ,выполнив скрипт  change_repl.ksh:

        #!/usr/bin/ksh

        for TABLE in `cat table_list`
        do
        cdr change replicate  -a repl_${TABLE} sitesdata@server_cp:informix.${TABLE}   \
          "select * from ${TABLE}"
        if [ $? == 0 ] then
          echo "repl _"${TABLE}" updated OK"
        else
          echo "repl_"${TABLE}" update failed"
          exit 1
        fi
        done

Выполним  "suspend" всех серверов в направлении  g_cp.

        informix@server_cp$ cdr suspend server g_cp g_tp g_ft g_sc

Стартуем репликации на g_cp ,выполнив скрипт start_repl.ksh:-

        #!/usr/bin/ksh
        for TABLE in `cat table_list`
        do
        cdr start replication repl_${TABLE}  g_cp
        if [ $? == 0 ] then
          echo "repl_"${TABLE}" started OK"
        else
          echo "repl_"${TABLE}" start failed"
          exit 1
        fi
        done

С этого момента транзакции помещаются в очереди, но не реплицируются

Выгрузим данные на сервере server_tp (g_tp) :-

informix@server_tp$ nohup onpunload.ksh>unload.log 2>&1 &

        #!/usr/bin/ksh
        # onpunload.ksh. Script invokes onpload utility to unload data on any 
        # running ER server
        # Unload job named unload_${TABLE} has been already created in HPL 
        # environment and stored in  onpload database for each TABLE  value 
        # in table_list file.
        # Autogenerate Load Components panel  configured  output file as
        # /dataserver/unload/${TABLE}.dat,  target database as  "sitesdata" and table 
        # as ${TABLE}
        ########################################################################
        for TABLE in `cat table_list`
        do
        onpload -p sites -j   unload_$(TABLE)  -fu
        if [ $? == 0 ] then
          echo "repl_"${TABLE}" unloaded OK"
        else
          echo "repl_"${TABLE}"unload failed"
          exit 1
        fi
        done

 Compress all unloaded ASCII  files ,create tar ball and download to
 /dataserver/load on server_cp. Untar ball and uncompress *.Z files in
 /dataserver/load directory on server_cp.

Загрузим данные на севере g_cp:

        informix@server_cp$ nohup onpload.ksh>load.log 2>&1 &

        #!/usr/bin/ksh
        # onpload.ksh
        # Script invokes onpload utility to load data on ER server supposed to be 
        # synchronized.
        # Load job named load_${TABLE} has been already created with Deluxe    
        # without replication option in High Performance Loader Environment and 
        # stored in onpload database for each TABLE  value in table_list file.
        # Autogenerate Load Components panel  configured input file as
        # /dataserver/load/${TABLE}.dat,target database name "sitesdata" and table 
        # as ${TABLE}
        ########################################################################
        for TABLE in `cat table_list`
        do
        onpload -p sites  -j load_${TABLE}  -fcl
        if [ $? == 0 ] then
          echo ${TABLE}" loaded OK"
        else
          echo ${TABLE}" load failed"
          exit 1
        fi
        done

Стартуем репликации на всех ER серверах, отменив статус "suspended":

        informix@server_tp$ cdr resume server g_cp g_tp g_ft g_sc

 С этого момента система может войти в режим с чрезвычайно высокой
активностью транзакций на всех серверах , входящих в Update Anywhere
Enterprise Replication. Размеры  "Send dbspace" и  "Receive dbspace" дожны
быть достаточно велики,чтобы аккомодировать эту активность.

 Общая длина журналов протоколирования транзакций тоже должна быть 
достаточно велика, с учетом того,что LTXHWM > 2*LTHWM для ER
сервера.То есть транзакция должна быть откачена до достижения LTXHWM.
"DDR threads" могут по нескольку раз стартовать и заканчивать "catch up phase"
на любом из серверов системы. Это поведение следует рассматривать как
нормальное.


<< Предыдущая	ИНДЕКС	Поиск в статьях	src	Установить закладку	Перейти на закладку	Следующая >>

Обсуждение

[ RSS ]

1, Борис Державец (?), 13:52, 25/01/2005 [ответить]	+/–
Сравни с проблемами описанными в :- http://www.linuxgazette.com/node/9855 для решения совершенно идентичной проблемы в Oracle 9.2.0.5 & 10.1.0.2

Добавить комментарий

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2026 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру