用于CUDA的NVIDIA卡和用于Ubuntu 16.04的AMD卡


11

我正在使用Ubuntu 16.04,因为它是我发现使用卷积神经网络(CNN)更为方便的操作系统。直到我想在同一系统上安装两个图形卡之前,安装Ubuntu的过程都很好。

  • NVIDIA 970 GTX
  • AMD R9 380

我只想将NVIDIA卡用于CUDA,以便能够将其所有图形内存和AMD用于图形用户界面。为此,所有监视器都将插入此卡。

问题:

  • 当我安装nvidia和cuda 8.0驱动程序时一切正常,但是当我安装AMD驱动程序时,我无法登录lightdm。
  • 如果我将显示器插入AMD卡,则表示lightdm在低图形模式下运行,无任何作用。
  • 修改xorg.conf文件没有任何区别,因为它被gpu-manager覆盖

我找不到任何说明该怎么做的教程。


请剪切帖子的答案部分并将其粘贴到下面的单独答案中。
edwinksl

好吧,我做到了..
Marcus

Answers:


11

开始之前,我建议安装ssh,以便在出现问题时能够远程关闭系统。为此,请使用以下命令:

sudo apt-get install ssh

要关闭系统,必须与另一台计算机或移动设备一起使用ssh并使用以下命令:

sudo shutdown -r now

步骤1

首先,您必须实际卸下AMD卡,保留NVIDIA卡并安装CUDA和NVIDIA驱动程序。您可以从此处下载cuda:https//developer.nvidia.com/cuda-downloads

使用以下命令确保所有文件都在工作:

nvidia-smi

第2步

此时,由于我们正在使用图形卡,因此必须修改grub才能在控制台模式下启动。

使用您喜欢的编辑器(在我的情况下为joe)编辑默认的grub配置文件:

sudo joe /etc/default/grub

并更改这些行:

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
GRUB_CMDLINE_LINUX=""
#GRUB_TERMINAL=console

这些:

GRUB_CMDLINE_LINUX_DEFAULT="text"
GRUB_CMDLINE_LINUX="text"
GRUB_TERMINAL=console

最后使用以下命令更新grub:

sudo update-grub

第三步

关闭系统,卸下NVIDIA卡,然后插入AMD卡。打开计算机并安装最新的AMD图形驱动程序。就我而言,我使用以下命令安装了驱动程序:

wget https://www2.ati.com/drivers/linux/ubuntu/amdgpu-pro-16.40-348864.tar.xz
tar -Jxvf amdgpu-pro-16.40-348864.tar.xz
cd amdgpu-pro-16.40-348864/
./amdgpu-pro-install
sudo usermod -a -G video $USER

重启你的电脑。现在,您可以使用以下命令启动lightdm(用户界面):

sudo service lightdm start

所有这些都应按预期工作,现在您可以使用系统设置来设置显示器。

第四步

关闭系统,然后添加您的NVIDIA卡,并且不要卸下AMD(此时,您的系统中将有两张图形卡)。打开计算机并使用您的用户名登录,但不要启动LIGHTDM!

此时,gpu-manager已自动为控制台模式设置了两个图形卡,为lightdm仅设置了AMD(因为我们在上一步中启动了lightdm)。如果我们在这一点上运行lightdm,那么gpu-manager将会一团糟。所以现在我们必须完全禁用gpu-manager。为此,我们必须再次修改grub:

sudo joe /etc/default/grub

并替换这些行:

GRUB_CMDLINE_LINUX_DEFAULT="text"
GRUB_CMDLINE_LINUX="text"
GRUB_TERMINAL=console

通过这些:

GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nogpumanager"
GRUB_CMDLINE_LINUX=""
#GRUB_TERMINAL=console

最后使用以下命令更新grub:

sudo update-grub

第5步

重新启动系统,如果lightdm无法正确启动(显示黑屏),则必须按Ctrl + F1,以控制台方式登录,然后将此命令添加到rc.local文件中:

sudo joe /etc/rc.local

在“ exit 0”之前添加以下行:

service lightdm start

重新启动系统,现在一切都应该正常工作...

在控制台中,可以使用以下命令检查两个图形cad是否都在使用:

lspci -nnk | grep -i vga -A3 | grep 'in use'

Kernel driver in use: amdgpu
Kernel driver in use: nvidia

和nvidia-smi应该工作正常。显示您正在使用0 MB的内存:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 375.26                 Driver Version: 375.26                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 970     Off  | 0000:02:00.0     Off |                  N/A |
| 30%   42C    P0    36W / 163W |      0MiB /  4036MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

我一直在努力使它工作几天。您在Ubuntu 16.04上使用了哪个内核?
亚伦·斯科姆拉

你成功了吗?
Szymon Roziewski

1
@ d84_n1nj4我没有尝试过ubuntu 18.04,也许它可以直接运行而无需执行所有这些步骤...如果可以分享您的经验,那将是很好的。
Marcus

1
@Marcus我会做。应该在星期一开始/完成。好吧,亚马逊一发布我的缺货4K显示器> <
d84_n1nj4 '18

2
@Marcus在连接后实际上直接起作用了-我不必执行任何步骤^^
d84_n1nj4
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.