【アプリケーション】AlphaFold 更新のお知らせ(民間利用可能)

既報の通り タンパク質の構造予測を行うソフトウェアAlphaFoldをType IIサブシステム上で簡単に利用できるように整備しています。 この度、AlphaFoldの利用規約が更新されアカデミックユーザ以外でも(民間利用のユーザも)利用可能となりましたので、 対応する版のAlphaFoldを準備し直しました。 是非ご利用ください。

AlphaFold の利用方法

ディレクトリの構成と使い方

AlphaFold を /center/local/app/x86/AlphaFold にインストールしました。 このディレクトリ内にあるサブディレクトリがバージョンに対応しています。

v2.1.1 ディレクトリの中身は従来からインストールしてあったものと同様です。 (サンプルスクリプト内のディレクトリパス情報は更新してあります。) アカデミックユーザしか利用できません。

v2.1.2 ディレクトリの中身は新たにインストールしたものであり、民間利用のユーザも利用できます。 v2.1.1からの差分についてはAlphaFoldのリリース情報をご確認ください。

今後さらにバージョンが更新された際には同じ階層にディレクトリを追加していく予定です。

ジョブスクリプトの例は各ディレクトリ内に置いてあります。 ファイルをコピーし、ジョブの最長実行時間であるelapseや、 入出力先を指定しているFASTAFILEやOUTPUTDIRなどを調整してご利用ください。 NVMESHを使う場合はcxgfs-で始まるリソースグループを使わねばならない点に注意してください。

  • /center/local/app/x86/AlphaFold/VERSION/samples/run_alphafold_nvmesh.sh NVMESHを使う場合用
  • /center/local/app/x86/AlphaFold/VERSION/samples/run_alphafold.sh NVMESHを使わない場合用

各ジョブスクリプトは内部で以下のスクリプトを呼び出しています。実行時オプションの精査などの参考にしてください。

  • /center/local/app/x86/AlphaFold/VERSION/alphafold/bin/alphafold_nvmesh NVMESHを使う場合用
  • /center/local/app/x86/AlphaFold/VERSION/alphafold/bin/alphafold NVMESHを使わない場合用

いずれもVERSIONの部分には利用するAlphaFoldのバージョン(v2.1.1v2.1.2)のバージョンが入ります。

alphafoldまたはalphafold_nvmeshを修正して使いたい場合は、ファイルを手元にコピーして修正し、 run_alphafold_nvmesh.shまたはrun_alphafold.shも手元にコピーして最後のalphafoldまたはalphafold_nvmesh呼び出し部分で 修正した版が呼び出されるように書き換えてください。

もちろん、自分でインストールしたAlphaFoldからNVMesh上のデータを参照して利用していただいても構いません。

データベースファイル等について

実行時に必要となるデータベースはv2.1.1公開時と同じ場所に置いてあります。 (引き続き継続的に更新したいと考えていますが、追従が遅れることがあります。ご了承ください。)

  • /data/group1/a49979a/share/alphafold_data/db-v2.1
  • /beegfs/a49979a/alphafold/db-v2.1

各ディレクトリに同じデータが置いてあります。 後者はNVMESHに置いてあり、前者と比べてずっと高速に処理が行えるため、特に理由がない限りはこちらの利用を推奨します。 1例としては、10時間以上かかるHHblits処理が10分に短縮される例が確認できています。 利用にあたって特に申請等は必要ありません。cxgfs-系のリソースグループを使わないと参照できない点にだけ注意してください。

NVMESH:Type IIサブシステムの計算ノードに搭載されたSSDを束ねて構築した共有ストレージ。 ジョブにオプションを加えるだけですぐに利用できるBeeONDと異なり利用には申請が必要だが、 BeeONDと異なりジョブの開始終了時に消去されないため、今回のように大容量のデータを継続的に利用するのに適している。 なおBeeONDと同様にローカルSSDとしての利用はできなくなる。