Top / lcgtest01
lcgtest01

CERN-N研間の計算機構築log

とりあえずやること

検証することは以下のこと

  1. AFS cliant が正しく動作すること。
  2. Athena が動作すること
  3. NFS サーバにする <-- これはやらない
  4. Grid に job を投げられるか。

マシンスペック

CPU:Xeon 5410 @2.33GHz Dual Core
RAM:2GB
HDD:160GB

64bitマシン

SLC5 のインストール

準備

ISO image を DVD に焼く。 ISOLinux が入ってるので boot disk を用意擦る必要がない。
今回は SLC 5.3 x86_64bit を用意した。(2010/1/5 5.4にアップデート確認)

ネットワーク関係の設定

2つのイーサネットポートが見つかるが、片方で良いはず。 eth0にネットワークケーブルが刺さっている?
設定は以下の内容

hostname.domainname:lcgtest01.hepl.phys.nagoya-u.ac.jp
IP Adress:202.13.193.132/255.255.255.0
Gateway:202.13.193.14
DNS:202.13.193.34

その他

GURB、serverGUI その他のソフトウェアもいれた。
インストール時間はおよそ160分程度かかる。

インストールした時のログー> install log

ユーザー

ユーザーの追加、削除、パスワードの設定は

useradd username 追加
userdel username 削除
passwd username パスワード設定

で設定できる。
ユーザー自身でパスワードを設定するときには

passwd

で変えられる。 今までのパスワードが必要になる。

yumアップデート

yum update をすると dbus において Transaction Check Error で弾かれる。

以下ログ

Tracsaction Check Error
  file /etc/dbus-1/system.conf from install of dbus-1.1.2-12.el5.i386 conflicts with file from package dbus-1.1.2-12.el5.x86_64

32bit用のパッケージと64bit用のパッケージが競合??

dbus 含めないでアップデート

yum update --exclude=dbus*

依存するパッケージをinstallしてから、rpmパッケージをダウンロードしてきてから手動でインストール

yum install expat
rpm -Uvh --force
yum update

めでたく Error が出なくなった。(2010/1/5 どうやら画面出力関係でアップデートできなくなっていたらしい。無理やりアップデートさせたので、Xが立ち上がらなくなった。まあいいか...)

OpenAFSのインストール

なんかインストールされていた。。。サービスも起動していたし。。。
install の際に default で入るらしい。

Kerberosの設定

LXPLUSの /etc/krb5.conf をコピーしてくる。

それが終わったら以下のコマンドを実行

kinit -5 username@CERN.CH

/afs/user/ の自分のフォルダ内が読み書きできる。他の人はダメみたい。

klist

をやってみて ticket がいつまで有効か確かめてみる。

Ticket cache: FILE:/tmp/krb5cc_500_5F99ut
Default principal: wakajun@CERN.CH

Valid starting     Expires            Service principal
10/28/10 12:47:29  10/29/10 13:47:29  krbtgt/CERN.CH@CERN.CH
        renew until 11/02/10 11:47:29
10/28/10 12:47:33  10/29/10 13:47:29  afs@CERN.CH
        renew until 11/02/10 11:47:29


Kerberos 4 ticket cache: /tmp/tkt500
klist: You have no tickets cached

参考URL : http://linux.web.cern.ch/linux/docs/kerberos-access.shtml

ATHENA

奥村さんのwikiを参考にする。
CMT、SVN の設定をしなければならない。とりあえず /afs 以下にあるファイルで動くらしい。非常に遅く、使用に耐えない。(何をするにも数分待たされる。)

参考 file.bashrc  filerequirements

HelloWorld

https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookRunAthenaHelloWorld<--ここを参考に

source setup.sh -tag=AtlasProduction,15.5.1

を実行してから

cd ../run
get_files HelloWorldOptions.py
athena.py HelloWorldOptions.py

とする。
4分程度がかかるが、放置。 すると以下のようなメッセージが出る。 HelloWorld INFO/WERNING/ERROR/FATAL 〜 がでれば良いのかな?
よく解らん。

...
HelloWorld           INFO initialize()
HelloWorld           INFO   MyInt =    42
HelloWorld           INFO   MyBool =   1
HelloWorld           INFO   MyDouble = 3.14159
HelloWorld           INFO   MyStringVec[0] = Welcome
HelloWorld           INFO   MyStringVec[1] = to
HelloWorld           INFO   MyStringVec[2] = Athena
HelloWorld           INFO   MyStringVec[3] = Framework
HelloWorld           INFO   MyStringVec[4] = Tutorial
...
AthenaEventLoopMgr   INFO   ===>>>  start of run 0    <<<===
AthenaEventLoopMgr   INFO   ===>>>  start of event 1  <<<===
...
HelloWorld           INFO execute()
HelloWorld           INFO An INFO message
HelloWorld        WARNING A WARNING message
HelloWorld          ERROR An ERROR message
HelloWorld          FATAL A FATAL error message
...

Pacman install

Athena をローカルにインストールするために必要らしい。
このページを参考にしてインストール
https://twiki.cern.ch/twiki/bin/view/Atlas/WorkBookInstallingAtlasSoftware

Pacmanのパッケージをダウンロードする。ファイルは pacman-latest.tar.gz

wget http://atlas.bu.edu/~youssef/pacman/sample_cache/tarballs/pacman-latest.tar.gz

ここで ATLAS, CMT setup scripts を source していないクリーンシェルを用意する。

tar zxvf pacman-latest.tar.gz
cd pacman-x.xx

x.xx はバージョン。

source setup.sh
cd ..
pacman -lc am-CERN

Download 可能なパッケージが表示される。

ATLASRelease install

SLC5.4 x86_64 なので SLC5 64bit のパッケージをインストールする。具体的には x86_64_gcc43_slc5 のパッケージ。

mkdir atlas/
cd atlas/

その後インストールを行う。

pacman -get KV:gcc432_x86_64_slc5
pacman -allow trust-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_5_1_x86_64_slc5_gcc43_opt

かなり時間がかかるが、ひたすら我慢。数GB程度ディスクを使うので注意。
Pythia の部分で激しく

WARNING:Untarring tarball [...] will overwire [...] 

が出る。。何故か上書きしているらしい。大丈夫か?
ファイル一覧(atlas/)

CMT/              trusted.caches    pacman/      AtlasSettings/
AtlasLogin/       sw/               DBRelease/   atlas/
project/          usr/              LCGCMT/      Gaudi/
AtlasCore/        AtlasConditions/  AtlasEvent/  AtlasReconstruction/
AtlasTrigger/     AtlasAnalysis/    geant4/      external/
AtlasSimulation/  AtlasProduction/  cmtsite/     AtlasOffline/
KV-15.5.1/        setup.sh          setup.csh    o..pacman..o/

いくつか足りないが・・・

source setup.sh
pacman -get am-CERN:KV-15.5.1

とりあえずこれをやってみる。

About to execute: ./KitValidation/*/share/KitValidation -r 15.5.1 -p /home/wakajun/atlas -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPool ElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToES D.kvt,ESDtoAOD.kvt,DC3,DC3PyJT
AtlasLogin: Configuration problem - CMTCONFIG (i686-slc4-gcc34-opt) not available for /home/wakajun/atlas/AtlasProduction/15.5.1
Cannot parse conf file ./KitValidation/KitValidation/share/../templates/template.kvt
Cannot parse conf file /home/wakajun/atlas/AtlasAnalysis/15.5.1/InstallArea/share/PhysValJet_TestConfiguration.xml
Cannot parse conf file /home/wakajun/atlas/AtlasTrigger/15.5.1/InstallArea/share/TrigTauPerformAthena_TestConfiguration.xml

############################################################
##        Atlas Distribution Kit Validation Suite         ##
##                 19-09-2009  v1.9.23-1                  ##
##                                                        ##
## Alessandro De Salvo <Alessandro.DeSalvo@roma1.infn.it> ##
############################################################
Testing AtlasProduction 15.5.1
--------  Problem report -------
[TRF_ATHENACRASH:62600]
AthenaCrash
================================
Athena Hello World                            [FAILED][ERR=  2]
MooSegmentMakerAlgs compilation               [FAILED][ERR=  2]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Generation                       [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
DB Release consistency check                  [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Simulation                       [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Digitization                     [FAILED][ERR=  1]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Reconstruction                   [FAILED][ERR=  1] 

##################################################
##   AtlasProduction 15.5.1 Validation [FAILED]
##################################################  

Package [/home/wakajun/atlas:am-CERN:Diagnostics:http://atlas-computing.web.cern.ch/atlas-computing/links/monolith/whole/Diagnostics:KV-15.5.1] not [installed]:
        Shell command [./KitValidation/*/share/KitValidation -r 15.5.1 -p /home/wakajun/atlas -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProduction --disable AthenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,AthenaPoolElementLinks.kvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvt,ESDtoAOD.kvt,DC3,DC3PyJT] returns with an error code.

失敗したorz slc4 32bit 用の gcc34 が必要らしい?

とりあえず http://linuxsoft.cern.ch/cern/slc5X/i386/SL/ から以下を持ってくる。

compat-gcc-34-3.4.6-4.i386.rpm
compat-gcc-34-c++-3.4.6-4.i386.rpm
compat-libf2c-34-3.4.6-4.i386.rpm
compat-gcc-34-g77-3.4.6-4.i386.rpm
compat-glibc-headers-2.3.4-2.26.i386.rpm
compat-glibc-2.3.4-2.26.i386.rpm
compat-libgcc-296-2.96-138.i386.rpm
compat-libstdc++-296-2.96-138.i386.rpm
compat-libstdc++-33-3.2.3-61.i386.rpm
compat-readline43-4.3-3.i386.rpm
compat-db-4.2.52-5.1.i386.rpm
(lapack-3.0-37.el5.i386.rpm)
libXpm-3.5.5-3.i386.rpm
openssl097a-0.9.7a-9.el5_2.1.i386.rpm

この順番にインストールする。ただし、lapack は依存関係で

yum install lapack

をやった。

これでもダメ

ATLAS Release reinstall

上の方法では上手くいかないので、もう一度 http://www.icepp.s.u-tokyo.ac.jp/~sakamoto/work/Pukiwiki/pukiwiki.php?AthenaEnvironmentを参考にやった。

pacman -get KV:gcc432_x86_64_slc5
pacman -allow trust-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_5_1_x86_64_slc5_gcc43_opt

までは同じ。
gccのバージョンを変更する。

sourse atlas/slc5/gcc43/setup.sh

これと ~/atlas/ の setup.sh を source する。

CMTの準備

requirements ファイルを作り以下を書き込む。

set CMTSITE STANDALONE
set SITEROOT /home/wakajun/atlas
macro ATLAS_TEST_AREA ${HOME}/cmthome
macro ATLAS_DIST_AREA ${SITEROOT}
apply_tag projectArea
macro SITE_PROJECT_AREA ${SITEROOT}
macro EXTERNAL_PROJECT_AREA ${SITEROOT}
apply_tag opt 
apply_tag setup # athena実行時の環境設定も行う
apply_tag simpleTest # ATLAS_TEST_AREA以下にリリース番号でサブディレクトリーを作ります。
use AtlasLogin AtlasLogin-* $(ATLAS_DIST_AREA) # Atlas Release独自の環境設定をしてくれるパッケージです。
set CMTCONFIG x86_64-slc5-gcc43-opt

配置場所は ~/cmthome 次に以下を実行

source ~/atlas/CMT/v1r20p20090520/mgr/setup.sh

これでCMTのパスが通る。which コマンドで確かめる。
コンフィギュア

cmt config

これで setup.sh などができる。 次回以降はこの setup.sh を実行すれば良い。

source setup.sh -tag=AtlasProduction,15.5.1

これで standalon の状態で athena が走るハズ。

HelloWorld

HelloWorld のスクリプトをダウンロードする。

get_files -jo HelloWorldOptions.py

athena のパスが通っている事を確認して以下を実行する。

athena HelloWorldOptions.py

実行すると HelloWorld INFO/WERNING/ERROR/FATAL 〜 とかメッセージが出るハズ。

HelloWorld           INFO initialize()
HelloWorld           INFO   MyInt =    42
HelloWorld           INFO   MyBool =   1
HelloWorld           INFO   MyDouble = 3.14159
HelloWorld           INFO   MyStringVec[0] = Welcome
HelloWorld           INFO   MyStringVec[1] = to
HelloWorld           INFO   MyStringVec[2] = Athena
HelloWorld           INFO   MyStringVec[3] = Framework
HelloWorld           INFO   MyStringVec[4] = Tutorial
...
AthenaEventLoopMgr   INFO   ===>>>  start of run 0    <<<===
...
AthenaEventLoopMgr   INFO   ===>>>  start processing event #1, run #0 0 events  processed so far  <<<===
HelloWorld           INFO execute()
HelloWorld           INFO An INFO message
HelloWorld        WARNING A WARNING message
HelloWorld          ERROR An ERROR message
HelloWorld          FATAL A FATAL error message
...
Py:Athena            INFO leaving with code 0: "successful run"

と走った。めでたい。(今日はクリスマスイブだった。)

追記

上記ではgcc4.3とathenaを一緒のフォルダにインストールしていた。 そのため、セットアップスクリプトが上書きされgcc4.3が上手くいかない。

ユーザーローカルにインストールする際にはフォルダ構成を

${HOME}/atlas/release/15.6.1
${HOME}/atlas/atlas-gcc
${HOME}/atlas/pacman/pacman-3.29

などにしておかねばならない。
そしてcmthomeも以下のフォルダを作ってrequirementsを作る。 ついでに、testareaも別にする場合は別にフォルダを作る。

${HOME}/cmthome/15.6.1
${HOME}/testarea/15.6.1

requirementsの内容は以下の通り

set CMTSITE STANDALONE
set SITEROOT /home/wakajun/atlas/release/15.6.1
macro ATLAS_TEST_AREA ${HOME}/testarea
macro ATLAS_DIST_AREA ${SITEROOT}

apply_tag setup
apply_tag simpleTest

use AtlasLogin AtlasLogin-* $(ATLAS_DIST_AREA) 
set CMTCONFIG x86_64-slc5-gcc43-opt

kit install

ちなみに

pacman -get am-CERN:KV-15.5.1

をやってみると

/tmp/fileZvI0lw: line 270: 4SUITEROOT=/home/wakajun/atlas/LCGCMT/LCGCMT_/4suite: No such file or directory
/tmp/fileZvI0lw: line 270: export: `4SUITEROOT': not a valid identifier
/tmp/fileZvI0lw: line 271: 4SUITECONFIG=x86_64-slc5-gcc43-opt: command n
/tmp/fileZvI0lw: line 271: export: `4SUITECONFIG': not a valid identifie
Cannot parse conf file ./KitValidation/KitValidation/share/../templates/
Cannot parse conf file /home/wakajun/atlas/AtlasAnalysis/15.5.1/InstallA      et_TestConfiguration.xml
Cannot parse conf file /home/wakajun/atlas/AtlasTrigger/15.5.1/InstallArrformAthena_TestConfiguration.xml

############################################################
##        Atlas Distribution Kit Validation Suite         ##
##                 19-09-2009  v1.9.23-1                  ##
##                                                        ##
## Alessandro De Salvo <Alessandro.DeSalvo@roma1.infn.it> ##
############################################################
Testing AtlasProduction 15.5.1
Athena Hello World                            [  OK  ]
MooSegmentMakerAlgs compilation               [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Generation                       [FAILED][ERR= 99]
/home/wakajun/atlas/KV-15.5.1/tmp
DB Release consistency check                  [  OK  ]
/home/wakajun/atlas/KV-15.5.1/tmp 
Z -> e e jet Simulation                       [FAILED][ERR= 40]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Digitization                     [FAILED][ERR= 40]
/home/wakajun/atlas/KV-15.5.1/tmp
Z -> e e jet Reconstruction                   [FAILED][ERR= 40]

##################################################
##   AtlasProduction 15.5.1 Validation [FAILED]
##################################################

Package [/home/wakajun/atlas:am-CERN:Diagnostics:http://atlas- computing.computing/links/monolith/whole/Diagnostics:KV-15.5.1] not [installed]:
        Shell command [./KitValidation/*/share/KitValidation -r 15.5.1 -las -kng -t /home/wakajun/atlas/KV-15.5.1/tmp --bw --project AtlasProducenaPoolTest.kvt,AthenaPoolNavigation.kvt,AthenaPoolCaloCluster.kvt,Athenkvt,InDetDetDescrExample.kvt,Pythia_i.kvt,RecExCommon.kvt,RecExToESD.kvtDC3PyJT] returns with an error code.

となってダメorz
どうやったものか?

ATHENA更新

まずpacmanにPATHをとおしてから

pacman -lc am-BNL

でリストをアップデートする。 その後インストールしたいリリースのディレクトリを作ってインストール.

mkdir 15.6.8
cd 15.6.8
pacman -allow trunst-all-caches tar-overwrite -get am-CERN:AtlasProduction_15_6_8_x86_64_slc5_gcc43_opt

DQ2Clientのインストール

まずrootになってから以下のフォルダ以下にバージョンのフォルダを作る

/DQ2Client/0.1.3x

pacmanのセットアップをしてから今作ったフォルダにいく。 その後以下のコマンドを実行。

pacman -trust-all-caches -allow tar-overwrite -get http://atlas.web.cern.ch/Atlas/GROUPS/DATABASE/project/ddm/releases/pacman/cache:DQ2Clients

これでインストールができる。

またバージョンが変わるとセットアップスクリプトを変えねばならないので、/DQ2Clients/latest/に setup.sh のリンクを張ってこれを見に行く。

gcc43 の場所

afsではいかのディレクトリに置かれている。

/afs/cern.ch/sw/lcg/contrib/gcc/4.3.2/x86_64-slc5-gcc43-opt

USB disk をマウントする

ユーザーが書き込みを行うには fstab に以下の様に書くべし

/dev/sdb1    /mnt/usbdisk    auto    rw,auto,users 0 0

添付ファイル: filerequirements 757件 [詳細] file.bashrc 722件 [詳細]