Tips: IBM Power8 集群部署TensorFlow

最近某超算中心找到我们,看看能不能给他们给他们Power8的集群安装Tensorflow 1.14,他们的集群上每个节点都有两张K80(土豪啊),虽然我自己不搞机器学习,但是觉得算力也是很厉害的。

貌似两块K80

不同x86,Power8集群本来就比较少见,估计资料都不全,只好勉强答应了。幸亏集群上有conda,无脑conda install 就行,要是从源码编译,还没有root账号,估计搞很久,说实话,一把年纪了,对于从源码编译就比较怕。

https://anaconda.org/anaconda/tensorflow-gpu

一看conda的库,tf-gpu只有1.2版本,差点觉着要凉,折腾了许久,终于在reddit上发现了一个帖子,IBM有源可以支持到1.14,果然power这一套的东西也只有IBM才会去维护啊。

通过这一行设置最新的channel,叫法不一样而已,linux系叫source,conda系叫channel,其实都是一个东西

conda config --prepend channels https://public.dhe.ibm.com/ibmdl/export/pub/software/server/ibm-ai/conda/

把IBM的源加上后,顺利解决。

分享到:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注