國網vcs v100 最近要跑東西,用到沒有更新的硬體,v100也不知道支不支援用docker最新目前25.11,不能用看手冊,最多支援24.09但是僅有pytorch所以全部所需的要重裝但是離開docker,會清空所以要自製docker image以24.09為基礎,將所需都灌入docker訓練時,OK推論時,要注意記憶體破碎化的問題還要改程式,不然一樣會OOM如果不懂,參照gpt流程如果改用2張要注意指令有不一樣