ML平台搭建

春节期间跟Fu和MT聊了一次，觉得搞一下机器学习也是有希望的。开始幻想着有一个可以帮我鉴定仔稚鱼的图形分类器、一个帮我跟踪检索文献的AI ，开年就回来升级了电脑。CPU换了Core i5-6400，内存加到16G，GPU用了华硕的GTX 1060，加了m.2的128G SSD和1T的机械硬盘。

在MT两天的指导下，踏平了各种error，终于把环境配置好了。简单记录一下。

1、在SSD上安装了Ubuntu 16.04 desktop 64bit：从这里（官网）下载镜像，从这里（Universal USB Installer）下载U盘安装盘的制作工具。用Universal USB Installer将官网下载的iso装到U盘上，重启电脑选择U盘启动，注意选对安装的目标盘。下一步，下一步，下一步…………

2、安装驱动遇到一些麻烦。装好Ubuntu后从NV官网下载了.run的驱动程序，点开运行最后报编码错。在MT的指导下用tty执行安装，装好后重启卡在登陆页面死循环，尝试了很多办法都搞不定。本来计划第二天干掉图形界面，第二天早上开机显示器直接报“信号超出范围”什么的，索性重装了Ubuntu。然后根据机器之心一篇文章里提的方法，直接安装CUDA toolkit 8.0，因为CUDA toolkit 8.0会同时给你装上CUDA和显卡驱动，而且不会出现前面那些问题。确实是这样，后面于是都很顺利了，至少在我机器上很顺利了。具体方法参考这里，指令我抄在下面
wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_8.0.44-1_amd64.deb sudo dpkg -i cuda-repo-ubuntu1604_8.0.44-1_amd64.deb sudo apt-get update sudo apt-get install cuda

然后运行
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}} export LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LIBRARY_PATH:+:${LIBRARY_PATH}}

没有出错的话，CUDA就装好了，也可以在侧边栏的设置-系统和更新-additional driver里看到已经是勾选着NV的驱动

重启，然后用python -V检查一下python的版本，按照tensorflow官网的安装说明按部就班地装：

首先需要注册NV开发者账号，然后下载cuDNN，把cuDNN解压的两个文件复制到CUDA安装路径下对应的文件夹里：

sudo cp cuDNN/cuda/include/cudnn.h /usr/local/cuda/ sudo cp cuDNN/cuda/lib64/* /usr/local/cuda/lib64/

当然安装路径可能不一样，cuDNN是tensorflow要求装的，NV还提供了一些其他的库。

还要装一个libcupti-dev库，容易看漏：
sudo apt-get install libcupti-dev

然后安装pip，我看用pip安装步骤最少，所以……

sudo apt-get install python-pip python-dev

虽然不知下面这个为了啥，还是照做了

Ensure proper protobuf dependencies by

sudo pip uninstall tensorflow （python3的话 pip要换成pip3）

然后：

pip install tensorflow-gpu （GPU版本）

就好了……

然后装了个openssh，方便远程
sudo apt-get install openssh-server

ifconfig查看本机ip，路由器上做了个虚拟服务开放22端口

sudo service ssh status 启动ssh service

回到家试了试先连到单位vpn，然后ssh到路由器ip，杠杠地成功了。

Leave a Reply Cancel reply