[[ASAP Top]]
急いで復旧せねば
何をしたかの健忘録

まず/opt/tca/p3driver_ver20151029/scripts/init-peach3-all.sh
を実行すると
insmod:error inserting '/opt/tca/kernel/nvidia_p2p_tca.ko': -1 Unknown symbol in module
と表示される.

このエラーがはかれる前日か前々日にCUDA8.0をインストールし,その時デバイスドライバも更新してしまったためエラーが出るようになったと考え,
cuda-drivers.x86_64 ver367.48-1 から cuda-drivers.x86_64 ver352.39-0にダウングレード
yum downgrade cuda-drivers.x86_64

しかし状況変わらず

dmesgを確認
nvidia_p2p_tca: disagrees about version of symbol nvidia_p2p_get_pages
nvidia_p2p_tca: Unknown symbol nvidia_p2p_get_pages
と表示されている

調べたところvermagicとかmodversionとかいうバージョンがカーネルに埋め込まれ,このバージョンが違うとエラーを吐くらしい
ネットではむりやりバージョンを書き換えてビルドし直したりしているがさすがにそれは出来ないだろう

とりあえず/opt/tca/kernel/で
modinfo nvidia_p2p_tca.koを実行
以下結果

filename:       nvidia_p2p_tca.ko
license:        GPL
author:         Toshihiro Hanawa, U. Tsukuba, Japan & NVIDIA Corporation
srcversion:     A6E0CAC47BAD4B1FE24E1E1
depends:        nvidia
vermagic:       2.6.32-573.7.1.el6.x86_64 SMP mod_unload modversions

おそらくvermagicの値がどこかと違ってエラーを吐いているのだろう…よくわからぬ……

と思ったらcuda-drivers.x86_64のダウングレードが出来てなかった
cat /proc/driver/nvidia/versionがまだ最新になってる.
バージョンを指定してダウングレードする必要があったらしい.
やりなおす

sudo /usr/bin/nvidia-uninstall
で最新版のcuda-driverをアンインストール

その後cuda7.0のtoolkitをダウンロードしてきてdriverをインストール

無事peach3がロードできるようになった

しかしtcaWaitDMARecvDesc()が動作しない
tcaWaitDMAC()であれば動作する

一応致命的な状況は脱出
今後cudaのインストールには気をつけねば……


トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS