lcgtest01 のバックアップ(No.16)


CERN-N研間の計算機構築log

とりあえずやること

検証することは以下のこと

  1. AFS cliant が正しく動作すること。
  2. Athena が動作すること
  3. NFS にする。サーバにする。
  4. Grid に job を投げられるか。

マシンスペック

CPU:Xeon 5410 @2.33GHz Dual Core
RAM:2GB
HDD:160GB

64bitマシン

SLC5 のインストール

準備

ISO image を DVD に焼く。 ISOLinux が入ってるので boot disk を用意擦る必要がない。
今回は SLC 5.3 x86_64bit を用意した。

ネットワーク関係の設定

2つのイーサネットポートが見つかるが、片方で良いはず。 eth0にネットワークケーブルが刺さっている?
設定は以下の内容

hostname.domainname:lcgtest01.hepl.phys.nagoya-u.ac.jp
IP Adress:202.13.193.132/255.255.255.0
Gateway:202.13.193.14
DNS:202.13.193.34

LinuxのマシンでIP addressを変更する場合、以下のファイルを書き換える。

/etc/hosts
/etc/sysconfig/network
/etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
ONBOOT=yes
BOOTPROTO=static
IPADDR=192.168.0.1
NETMASK=255.255.255.0
GATEWAY=192.168.1.254

Linux のマシンで host name を変更する場合、以下のファイルを書き換える。

/etc/hosts
NETWORKING=yes
HOSTNAME=ホスト名
/etc/sysconfig/network
127.0.0.1      ホスト名  localhost.localdomain

その他

GURB、serverGUI その他のソフトウェアもいれた。
インストール時間はおよそ160分程度かかる。

インストールした時のログー> install log

ユーザー

ユーザーの追加、削除、パスワードの設定は

useradd username 追加
userdel username 削除
passwd username パスワード設定

で設定できる。

yumアップデート

yum update をすると dbus において Transaction Check Error で弾かれる。

以下ログ

Tracsaction Check Error
  file /etc/dbus-1/system.conf from install of dbus-1.1.2-12.el5.i386 conflicts with file from package dbus-1.1.2-12.el5.x86_64

32bit用のパッケージと64bit用のパッケージが競合??

dbus 含めないでアップデート

yum update --exclude=dbus*

依存するパッケージをinstallしてから、rpmパッケージをダウンロードしてきてから手動でインストール

yum install expat
rpm -Uvh --force
yum update

めでたく Error が出なくなった。

OpenAFSのインストール

なんかインストールされていた。。。サービスも起動していたし。。。
install の際に default で入るらしい。

Kerberosの設定

LXPLUSの/etc/krb.realms, /etc/krb.conf, /etc/krb5.conf をコピーしてくる。

それが終わったら以下のコマンドを実行

kinit -5 username@CERN.CH
klog username

/afs/user/ の自分のフォルダ内が読み書きできる。他の人はダメみたい。

ATHENA

奥村さんのwikiを参考にする。
CMT、SVN の設定をしなければならない。とりあえず /afs 以下にあるファイルで動くらしい。非常に遅く、使用に耐えない。(何をするにも数分待たされる。)

参考 file.bashrc  filerequirements

HelloWorld

https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookRunAthenaHelloWorld<--ここを参考に

source setup.sh -tag=AtlasProduction,15.5.1

を実行してから

cd ../run
get_files HelloWorldOptions.py
athena.py HelloWorldOptions.py

とする。
4分程度がかかるが、放置。 すると以下のようなメッセージが出る。 HelloWorld INFO/WERNING/ERROR/FATAL 〜 がでれば良いのかな?
よく解らん。

...
HelloWorld           INFO initialize()
HelloWorld           INFO   MyInt =    42
HelloWorld           INFO   MyBool =   1
HelloWorld           INFO   MyDouble = 3.14159
HelloWorld           INFO   MyStringVec[0] = Welcome
HelloWorld           INFO   MyStringVec[1] = to
HelloWorld           INFO   MyStringVec[2] = Athena
HelloWorld           INFO   MyStringVec[3] = Framework
HelloWorld           INFO   MyStringVec[4] = Tutorial
...
AthenaEventLoopMgr   INFO   ===>>>  start of run 0    <<<===
AthenaEventLoopMgr   INFO   ===>>>  start of event 1  <<<===
...
HelloWorld           INFO execute()
HelloWorld           INFO An INFO message
HelloWorld        WARNING A WARNING message
HelloWorld          ERROR An ERROR message
HelloWorld          FATAL A FATAL error message
...

Pacman install

Athena をローカルにインストールするために必要らしい。
このページを参考にしてインストール
https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookInstallingAtlasSoftware

Pacmanのパッケージをダウンロードする。ファイルは pacman-latest.tar.gz

wget http://atlas.bu.edu/~youssef/pacman/sample_cache/tarballs/pacman-latest.tar.gz

ここで ATLAS, CMT setup scripts を source していないクリーンシェルを用意する。

tar zxvf pacman-latest.tar.gz
cd pacman-x.xx

x.xx はバージョン。

source setup.sh
cd ..
pacman -lc am-CERN

Download 可能なパッケージが表示される。

ATLAS software install

SLC5.4 x86_64 なので SLC5 64bit のパッケージをインストールする。具体的には x86_64_gcc43_slc5 のパッケージ。

mkdir -p atlas/15.5.1
cd atlas/15.5.1

その後インストールを行う。

pacman -get KV:gcc432_x86_64_slc5
pacman -allow trust-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_5_1_x86_64_slc5_gcc43_opt

かなり時間がかかるが、ひたすら我慢。数GB程度ディスクを使うので注意。
Pythia の部分で激しく

WARNING:Untarring tarball [...] will overwire [...] 

が出る。。何故か上書きしているらしい。大丈夫か?
ファイル一覧(atlas/15.5.1/)

CMT/              trusted.caches    pacman/      AtlasSettings/
AtlasLogin/       sw/               DBRelease/   atlas/
project/          usr/              LCGCMT/      Gaudi/
AtlasCore/        AtlasConditions/  AtlasEvent/  AtlasReconstruction/
AtlasTrigger/     AtlasAnalysis/    geant4/      external/
AtlasSimulation/  AtlasProduction/  cmtsite/     AtlasOffline/
KV-15.5.1/        setup.sh          setup.csh    o..pacman..o/
source setup.sh
pacman -get am-CERN:KV-15.5.1
About to execute: ./KitValidation/*/share/KitValidation -r 15.5.1 -p /opt/atlas/15.5.1 -kng -t /opt/atlas/15.5.1/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPoolElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvt,ESDtoAOD.kvt,DC3,DC3PyJT
AtlasLogin: Info - ${HOME}/.subversion/config file created
AtlasLogin: Configuration problem - CMTCONFIG (i686-slc4-gcc34-opt) not available for /opt/atlas/15.5.1/AtlasProduction/15.5.1
Cannot parse conf file ./KitValidation/KitValidation/share/../templates/template.kvt
Cannot parse conf file /opt/atlas/15.5.1/AtlasAnalysis/15.5.1/InstallArea/share/PhysValJet_TestConfiguration.xml
Cannot parse conf file /opt/atlas/15.5.1/AtlasTrigger/15.5.1/InstallArea/share/TrigTauPerformAthena_TestConfiguration.xml

############################################################
##        Atlas Distribution Kit Validation Suite         ##
##                 19-09-2009  v1.9.23-1                  ##
##                                                        ##
## Alessandro De Salvo <Alessandro.DeSalvo@roma1.infn.it> ##
############################################################
Testing AtlasProduction 15.5.1
--------  Problem report -------
[TRF_ATHENACRASH:62600]
AthenaCrash
================================
Athena Hello World                            [FAILED][ERR=  2]
MooSegmentMakerAlgs compilation               [FAILED][ERR=  2]
/opt/atlas/15.5.1/KV-15.5.1/tmp
Z -> e e jet Generation                       [FAILED][ERR=  1]
/opt/atlas/15.5.1/KV-15.5.1/tmp
DB Release consistency check                  [  OK  ]
/opt/atlas/15.5.1/KV-15.5.1/tmp
Z -> e e jet Simulation                       [FAILED][ERR=  1]
/opt/atlas/15.5.1/KV-15.5.1/tmp
Z -> e e jet Digitization                     [FAILED][ERR=  1]
/opt/atlas/15.5.1/KV-15.5.1/tmp
Z -> e e jet Reconstruction                   [FAILED][ERR=  1] 

##################################################
##   AtlasProduction 15.5.1 Validation [FAILED]
################################################## 

Package [/opt/atlas/15.5.1:am-CERN:Diagnostics:http://atlas-computing.web.cern.ch/atlas-computing/links/monolith/whole/Diagnostics:KV-15.5.1] not [installed]:        Shell command [./KitValidation/*/share/KitValidation -r 15.5.1 -p /opt/atlas/15.5.1 -kng -t /opt/atlas/15.5.1/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPoolElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvt,ESDtoAOD.kvt,DC3,DC3PyJT] returns with an error code.