ASAP Top 急いで復旧せねば 何をしたかの健忘録

まず/opt/tca/p3driver_ver20151029/scripts/init-peach3-all.sh を実行すると insmod:error inserting '/opt/tca/kernel/nvidia_p2p_tca.ko': -1 Unknown symbol in module と表示される.

このエラーがはかれる前日か前々日にCUDA8.0をインストールし,その時デバイスドライバも更新してしまったためエラーが出るようになったと考え, cuda-drivers.x86_64 ver367.48-1 から cuda-drivers.x86_64 ver352.39-0にダウングレード yum downgrade cuda-drivers.x86_64

しかし状況変わらず

dmesgを確認 nvidia_p2p_tca: disagrees about version of symbol nvidia_p2p_get_pages nvidia_p2p_tca: Unknown symbol nvidia_p2p_get_pages と表示されている

調べたところvermagicとかmodversionとかいうバージョンがカーネルに埋め込まれ,このバージョンが違うとエラーを吐くらしい ネットではむりやりバージョンを書き換えてビルドし直したりしているがさすがにそれは出来ないだろう

とりあえず/opt/tca/kernel/で modinfo nvidia_p2p_tca.koを実行 以下結果

filename: nvidia_p2p_tca.ko license: GPL author: Toshihiro Hanawa, U. Tsukuba, Japan & NVIDIA Corporation srcversion: A6E0CAC47BAD4B1FE24E1E1 depends: nvidia vermagic: 2.6.32-573.7.1.el6.x86_64 SMP mod_unload modversions

おそらくvermagicの値がどこかと違ってエラーを吐いているのだろう…よくわからぬ……

と思ったらcuda-drivers.x86_64のダウングレードが出来てなかった cat /proc/driver/nvidia/versionがまだ最新になってる. バージョンを指定してダウングレードする必要があったらしい. やりなおす

sudo /usr/bin/nvidia-uninstall で最新版のcuda-driverをアンインストール

その後cuda7.0のtoolkitをダウンロードしてきてdriverをインストール

無事peach3がロードできるようになった

しかしtcaWaitDMARecvDesc()が動作しない tcaWaitDMAC()であれば動作する

一応致命的な状況は脱出 今後cudaのインストールには気をつけねば……


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-08-29 (木) 00:03:48