服务器初始化与环境部署
这篇文档是从一个裸机服务器到可用于开发和部署的环境的完整指南,涵盖了基础配置、安全加固、驱动安装、Python 环境搭建等方面。
适用系统:Ubuntu 20.04 / 22.04 / 24.04。
1. NVIDIA 驱动安装
1.1 安装依赖
bash
sudo apt update
sudo apt install -y build-essential dkms linux-headers-$(uname -r)
sudo apt install -y ubuntu-drivers-common1.2 查看推荐驱动并安装
bash
# 查看 Ubuntu 推荐驱动
ubuntu-drivers devices
# 安装驱动(示例)
sudo apt install -y nvidia-driver-580
sudo reboot1.3 验证
bash
nvidia-smi输出中能看到驱动版本、GPU 型号与显存信息即表示成功。
2. 装 Miniconda
2.1 下载与安装
bash
cd ~
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
# 安装
bash Miniconda3-latest-Linux-x86_64.sh2.2 让 conda 生效
bash
~/miniconda3/bin/conda init bash
source ~/.bashrc验证:
bash
conda --version能看到版本号就 OK。
2.3 配置国内源(清华 TUNA)
bash
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge
conda config --set show_channel_urls yes
# 查看配置
conda config --show channels2.4 创建环境
bash
conda create -n deeplab python=3.12 -y
conda activate deeplab
python -V首次使用前如果发现 conda 命令未生效,重新打开一个 shell 会话即可。
3. 最小验收清单
以下检查都通过,说明机器可以用于日常开发/部署:
sudo ufw status为 active 且规则正确sudo systemctl status ssh正常df -h和free -h资源正常nvidia-smi(GPU 机器)正常conda --version与python -V正常
4. 常见问题
4.1 nvidia-smi 失败
- 先确认驱动是否真的安装:
dpkg -l | grep nvidia-driver - 检查内核头文件:
linux-headers-$(uname -r) - 安装后必须重启:
sudo reboot
4.2 conda activate 无效
bash
~/miniconda3/bin/conda init bash
source ~/.bashrc如果你是 zsh,把 bash 改成 zsh。
4.3 SSH 无法连接
- 服务器安全组和 UFW 是否放行
22端口 sshd是否运行:sudo systemctl status ssh- 查看日志:
sudo journalctl -u ssh --no-pager -n 200