lcgtest01 のバックアップ(No.20)


CERN-N研間の計算機構築log

とりあえずやること

検証することは以下のこと

  1. AFS cliant が正しく動作すること。
  2. Athena が動作すること
  3. NFS にする。サーバにする。
  4. Grid に job を投げられるか。

マシンスペック

CPU:Xeon 5410 @2.33GHz Dual Core
RAM:2GB
HDD:160GB

64bitマシン

SLC5 のインストール

準備

ISO image を DVD に焼く。 ISOLinux が入ってるので boot disk を用意擦る必要がない。
今回は SLC 5.3 x86_64bit を用意した。

ネットワーク関係の設定

2つのイーサネットポートが見つかるが、片方で良いはず。 eth0にネットワークケーブルが刺さっている?
設定は以下の内容

hostname.domainname:lcgtest01.hepl.phys.nagoya-u.ac.jp
IP Adress:202.13.193.132/255.255.255.0
Gateway:202.13.193.14
DNS:202.13.193.34

LinuxのマシンでIP addressを変更する場合、以下のファイルを書き換える。

/etc/hosts
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.0.1
NETMASK=255.255.255.0
GATEWAY=192.168.1.254

Linux のマシンで host name を変更する場合、以下のファイルを書き換える。

/etc/hosts
NETWORKING=yes
HOSTNAME=ホスト名
/etc/sysconfig/network
127.0.0.1      ホスト名  localhost.localdomain

その他

GURB、serverGUI その他のソフトウェアもいれた。
インストール時間はおよそ160分程度かかる。

インストールした時のログー> install log

ユーザー

ユーザーの追加、削除、パスワードの設定は

useradd username 追加
userdel username 削除
passwd username パスワード設定

で設定できる。

yumアップデート

yum update をすると dbus において Transaction Check Error で弾かれる。

以下ログ

Tracsaction Check Error
  file /etc/dbus-1/system.conf from install of dbus-1.1.2-12.el5.i386 conflicts with file from package dbus-1.1.2-12.el5.x86_64

32bit用のパッケージと64bit用のパッケージが競合??

dbus 含めないでアップデート

yum update --exclude=dbus*

依存するパッケージをinstallしてから、rpmパッケージをダウンロードしてきてから手動でインストール

yum install expat
rpm -Uvh --force
yum update

めでたく Error が出なくなった。

OpenAFSのインストール

なんかインストールされていた。。。サービスも起動していたし。。。
install の際に default で入るらしい。

Kerberosの設定

LXPLUSの/etc/krb.realms, /etc/krb.conf, /etc/krb5.conf をコピーしてくる。

それが終わったら以下のコマンドを実行

kinit -5 username@CERN.CH
klog username

/afs/user/ の自分のフォルダ内が読み書きできる。他の人はダメみたい。

ATHENA

奥村さんのwikiを参考にする。
CMT、SVN の設定をしなければならない。とりあえず /afs 以下にあるファイルで動くらしい。非常に遅く、使用に耐えない。(何をするにも数分待たされる。)

参考 file.bashrc  filerequirements

HelloWorld

https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookRunAthenaHelloWorld<--ここを参考に

source setup.sh -tag=AtlasProduction,15.5.1

を実行してから

cd ../run
get_files HelloWorldOptions.py
athena.py HelloWorldOptions.py

とする。
4分程度がかかるが、放置。 すると以下のようなメッセージが出る。 HelloWorld INFO/WERNING/ERROR/FATAL 〜 がでれば良いのかな?
よく解らん。

...
HelloWorld           INFO initialize()
HelloWorld           INFO   MyInt =    42
HelloWorld           INFO   MyBool =   1
HelloWorld           INFO   MyDouble = 3.14159
HelloWorld           INFO   MyStringVec[0] = Welcome
HelloWorld           INFO   MyStringVec[1] = to
HelloWorld           INFO   MyStringVec[2] = Athena
HelloWorld           INFO   MyStringVec[3] = Framework
HelloWorld           INFO   MyStringVec[4] = Tutorial
...
AthenaEventLoopMgr   INFO   ===>>>  start of run 0    <<<===
AthenaEventLoopMgr   INFO   ===>>>  start of event 1  <<<===
...
HelloWorld           INFO execute()
HelloWorld           INFO An INFO message
HelloWorld        WARNING A WARNING message
HelloWorld          ERROR An ERROR message
HelloWorld          FATAL A FATAL error message
...

Pacman install

Athena をローカルにインストールするために必要らしい。
このページを参考にしてインストール
https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookInstallingAtlasSoftware

Pacmanのパッケージをダウンロードする。ファイルは pacman-latest.tar.gz

wget http://atlas.bu.edu/~youssef/pacman/sample_cache/tarballs/pacman-latest.tar.gz

ここで ATLAS, CMT setup scripts を source していないクリーンシェルを用意する。

tar zxvf pacman-latest.tar.gz
cd pacman-x.xx

x.xx はバージョン。

source setup.sh
cd ..
pacman -lc am-CERN

Download 可能なパッケージが表示される。

ATLASRelease install

SLC5.4 x86_64 なので SLC5 64bit のパッケージをインストールする。具体的には x86_64_gcc43_slc5 のパッケージ。

mkdir atlas/
cd atlas/

その後インストールを行う。

pacman -get KV:gcc432_x86_64_slc5
pacman -allow trust-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_5_1_x86_64_slc5_gcc43_opt

かなり時間がかかるが、ひたすら我慢。数GB程度ディスクを使うので注意。
Pythia の部分で激しく

WARNING:Untarring tarball [...] will overwire [...] 

が出る。。何故か上書きしているらしい。大丈夫か?
ファイル一覧(atlas/)

CMT/              trusted.caches    pacman/      AtlasSettings/
AtlasLogin/       sw/               DBRelease/   atlas/
project/          usr/              LCGCMT/      Gaudi/
AtlasCore/        AtlasConditions/  AtlasEvent/  AtlasReconstruction/
AtlasTrigger/     AtlasAnalysis/    geant4/      external/
AtlasSimulation/  AtlasProduction/  cmtsite/     AtlasOffline/
KV-15.5.1/        setup.sh          setup.csh    o..pacman..o/

いくつか足りないが・・・

source setup.sh
pacman -get am-CERN:KV-15.5.1

とりあえずこれをやってみる。

About to execute: ./KitValidation/*/share/KitValidation -r 15.5.1 -p /home/wakajun/atlas -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPool ElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToES D.kvt,ESDtoAOD.kvt,DC3,DC3PyJT
AtlasLogin: Configuration problem - CMTCONFIG (i686-slc4-gcc34-opt) not available for /home/wakajun/atlas/AtlasProduction/15.5.1
Cannot parse conf file ./KitValidation/KitValidation/share/../templates/template.kvt
Cannot parse conf file /home/wakajun/atlas/AtlasAnalysis/15.5.1/InstallArea/share/PhysValJet_TestConfiguration.xml
Cannot parse conf file /home/wakajun/atlas/AtlasTrigger/15.5.1/InstallArea/share/TrigTauPerformAthena_TestConfiguration.xml

############################################################
##        Atlas Distribution Kit Validation Suite         ##
##                 19-09-2009  v1.9.23-1                  ##
##                                                        ##
## Alessandro De Salvo <Alessandro.DeSalvo@roma1.infn.it> ##
############################################################
Testing AtlasProduction 15.5.1
--------  Problem report -------
[TRF_ATHENACRASH:62600]
AthenaCrash
================================
Athena Hello World                            [FAILED][ERR=  2]
MooSegmentMakerAlgs compilation               [FAILED][ERR=  2]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Generation                       [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
DB Release consistency check                  [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Simulation                       [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Digitization                     [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Reconstruction                   [FAILED][ERR=  1] 

##################################################
##   AtlasProduction 15.5.1 Validation [FAILED]
##################################################  

Package [/home/wakajun/atlas:am-CERN:Diagnostics:http://atlas-computing.web.cern.ch/atlas-computing/links/monolith/whole/Diagnostics:KV-15.5.1] not [installed]:
        Shell command [./KitValidation/*/share/KitValidation -r 15.5.1 -p /home/wakajun/atlas -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPoolElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvt,ESDtoAOD.kvt,DC3,DC3PyJT] returns with an error code.

失敗したorz slc4 32bit 用の gcc34 が必要らしい?

とりあえず http://linuxsoft.cern.ch/cern/slc5X/i386/SL/ から以下を持ってくる。

compat-gcc-34-3.4.6-4.i386.rpm
compat-gcc-34-c++-3.4.6-4.i386.rpm
compat-libf2c-34-3.4.6-4.i386.rpm
compat-gcc-34-g77-3.4.6-4.i386.rpm
compat-glibc-headers-2.3.4-2.26.i386.rpm
compat-glibc-2.3.4-2.26.i386.rpm
compat-libgcc-296-2.96-138.i386.rpm
compat-libstdc++-296-2.96-138.i386.rpm
compat-libstdc++-33-3.2.3-61.i386.rpm
compat-readline43-4.3-3.i386.rpm
compat-db-4.2.52-5.1.i386.rpm
(lapack-3.0-37.el5.i386.rpm)
libXpm-3.5.5-3.i386.rpm
openssl097a-0.9.7a-9.el5_2.1.i386.rpm

この順番にインストールする。ただし、lapack は依存関係で

yum install lapack

をやった。

これでもダメ

ATLAS Release reinstall

上の方法では上手くいかないので、もう一度 http://www.icepp.s.u-tokyo.ac.jp/~sakamoto/work/Pukiwiki/pukiwiki.php?AthenaEnvironmentを参考にやった。

pacman -get KV:gcc432_x86_64_slc5
pacman -allow trust-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_5_1_x86_64_slc5_gcc43_opt

までは同じ。
gccのバージョンを変更する。

sourse atlas/slc5/gcc43/setup.sh

これと ~/atlas/ の setup.sh を source する。

CMTの準備

requirements ファイルを作り以下を書き込む。

set CMTSITE STANDALONE
set SITEROOT /home/wakajun/atlas
macro ATLAS_TEST_AREA ${HOME}/cmthome
macro ATLAS_DIST_AREA ${SITEROOT}
apply_tag projectArea
macro SITE_PROJECT_AREA ${SITEROOT}
macro EXTERNAL_PROJECT_AREA ${SITEROOT}
apply_tag opt 
apply_tag setup # athena実行時の環境設定も行う
apply_tag simpleTest # ATLAS_TEST_AREA以下にリリース番号でサブディレクトリーを作ります。
use AtlasLogin AtlasLogin-* $(ATLAS_DIST_AREA) # Atlas Release独自の環境設定をしてくれるパッケージです。
set CMTCONFIG x86_64-slc5-gcc43-opt

配置場所は ~/cmthome 次に以下を実行

source ~/atlas/CMT/v1r20p20090520/mgr/setup.sh

これでCMTのパスが通る。which コマンドで確かめる。
コンフィギュア

cmt config

これで setup.sh などができる。 次回以降はこの setup.sh を実行すれば良い。

source setup.sh -tag=AtlasProduction,15.5.1

これで standalon の状態で athena が走るハズ。

HelloWorld

HelloWorld のスクリプトをダウンロードする。

get_files -jo HelloWorldOptions.py

athena のパスが通っている事を確認して以下を実行する。

athena HelloWorldOptions.py

実行すると HelloWorld INFO/WERNING/ERROR/FATAL 〜 とかメッセージが出るハズ。

HelloWorld           INFO initialize()
HelloWorld           INFO   MyInt =    42
HelloWorld           INFO   MyBool =   1
HelloWorld           INFO   MyDouble = 3.14159
HelloWorld           INFO   MyStringVec[0] = Welcome
HelloWorld           INFO   MyStringVec[1] = to
HelloWorld           INFO   MyStringVec[2] = Athena
HelloWorld           INFO   MyStringVec[3] = Framework
HelloWorld           INFO   MyStringVec[4] = Tutorial
...
AthenaEventLoopMgr   INFO   ===>>>  start of run 0    <<<===
...
AthenaEventLoopMgr   INFO   ===>>>  start processing event #1, run #0 0 events  processed so far  <<<===
HelloWorld           INFO execute()
HelloWorld           INFO An INFO message
HelloWorld        WARNING A WARNING message
HelloWorld          ERROR An ERROR message
HelloWorld          FATAL A FATAL error message
...
Py:Athena            INFO leaving with code 0: "successful run"

と走った。めでたい。(今日はクリスマスイブだった。)

kit install

ちなみに

pacman -get am-CERN:KV-15.5.1

をやってみると

/tmp/fileZvI0lw: line 270: 4SUITEROOT=/home/wakajun/atlas/LCGCMT/LCGCMT_/4suite: No such file or directory
/tmp/fileZvI0lw: line 270: export: `4SUITEROOT': not a valid identifier
/tmp/fileZvI0lw: line 271: 4SUITECONFIG=x86_64-slc5-gcc43-opt: command n
/tmp/fileZvI0lw: line 271: export: `4SUITECONFIG': not a valid identifie
Cannot parse conf file ./KitValidation/KitValidation/share/../templates/
Cannot parse conf file /home/wakajun/atlas/AtlasAnalysis/15.5.1/InstallA      et_TestConfiguration.xml
Cannot parse conf file /home/wakajun/atlas/AtlasTrigger/15.5.1/InstallArrformAthena_TestConfiguration.xml

############################################################
##        Atlas Distribution Kit Validation Suite         ##
##                 19-09-2009  v1.9.23-1                  ##
##                                                        ##
## Alessandro De Salvo <Alessandro.DeSalvo@roma1.infn.it> ##
############################################################
Testing AtlasProduction 15.5.1
Athena Hello World                            [  OK  ]
MooSegmentMakerAlgs compilation               [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Generation                       [FAILED][ERR= 99]
/home/wakajun/atlas/KV-15.5.1/tmp
DB Release consistency check                  [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp 
Z -> e e jet Simulation                       [FAILED][ERR= 40]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Digitization                     [FAILED][ERR= 40]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Reconstruction                   [FAILED][ERR= 40]

##################################################
##   AtlasProduction 15.5.1 Validation [FAILED]
##################################################

Package [/home/wakajun/atlas:am-CERN:Diagnostics:http://atlas- computing. computing/links/monolith/whole/Diagnostics:KV-15.5.1] not [installed]:
        Shell command [./KitValidation/*/share/KitValidation -r 15.5.1 -     las -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProduc        enaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,Athen        kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvtDC3PyJT] returns with an error code.

となってダメorz
どうやったものか?