实验一:平台搭建与环境配置
本实验旨在指导学生在 Windows 操作系统中完成 Python 开发环境的部署,涵盖 Anaconda、PyCharm、Jupyter Notebook 的安装,并配置适用于数据挖掘任务的 Python 3.7 环境。同时,将安装 PyTorch 2.2.2 及其他常用数据分析库。
1. 实验目的
- 在 Windows 系统上成功部署 Anaconda 及其 Python 运行环境。
- 创建独立的 Python 虚拟环境 DM(基于 Python 3.7),用于隔离项目依赖。
- 安装并配置集成开发工具 PyCharm 与交互式笔记本 Jupyter Notebook。
- 掌握使用 conda 和 pip 进行包管理的基本操作。
- 安装深度学习框架 PyTorch 2.2.2 以及数据处理相关库。
2. 系统与资源要求
- 操作系统:Windows 10 或 Windows 11
- 网络连接:稳定的互联网接入
- 软件需求:Anaconda 最新版、PyCharm Community/Professional 版本
- 磁盘空间:至少保留 10 GB 可用空间
3. 安装步骤
3.1 Anaconda 的安装
- 访问 Anaconda 官方网站,下载适用于 Windows 的安装程序。
- 双击安装文件,按照默认选项逐步完成安装流程。
- 安装完成后,启动 Anaconda Prompt,输入以下命令验证安装是否成功:
conda --version
conda --version
3.2 创建独立环境 DM (Python 3.7)
在终端中执行如下命令创建专用于数据挖掘的虚拟环境:
conda create -n DM python=3.7 -y
激活该环境:
conda activate DM
# 创建名为 DM 的 Python 3.7 环境
conda create -n DM python=3.7 -y
# 激活环境
conda activate DM
# 查看已有环境
conda env list
3.3 Jupyter Notebook 安装与启动
在已激活的 DM 环境中运行以下命令安装 Jupyter:
conda install jupyter -y
安装完成后,通过以下命令启动服务:
jupyter notebook
jupyter notebook
若浏览器自动打开 Jupyter 主界面,则表示安装和启动成功。
3.4 PyCharm 配置
- 从 JetBrains 官网获取并安装 PyCharm。
- 启动 PyCharm,进入项目设置路径:File → Settings → Project → Python Interpreter。
- 点击解释器配置区域的“Add Interpreter” → 选择“Conda Environment” → 使用已有环境(Existing Environment)。
- 指定 Conda 环境路径,确保指向 DM 环境中的 Python 解释器。
<Anaconda路径>\Scripts\conda.exe
3.5 PyTorch 2.2.2 安装
根据硬件支持情况选择合适的安装方式:
CPU 版本安装命令:
conda install pytorch==2.2.2 torchvision torchaudio cpuonly -c pytorch -y
GPU 版本安装命令(以 CUDA 11.8 为例):
conda install pytorch==2.2.2 torchvision torchaudio cudatoolkit=11.8 -c pytorch -y
安装后可通过以下命令验证 PyTorch 是否正确加载:
python -c "import torch; print(torch.__version__, torch.cuda.is_available())"
3.6 常用数据科学库安装
推荐优先使用 conda 安装以下核心库:
conda install numpy pandas matplotlib seaborn scikit-learn scipy -y
补充安装 UMAP 工具包:
conda install -c conda-forge umap-learn -y
对于 conda 不提供的库,可使用 pip 安装:
pip install h5py mygene tensorflow
4. 环境验证
在 Jupyter Notebook 或任意 Python 运行环境中执行以下代码段,确认各组件正常工作:
import sys
import torch
import numpy as np
print("Python:", sys.version)
print("PyTorch:", torch.__version__)
print("CUDA Available:", torch.cuda.is_available())
print("NumPy:", np.__version__)
预期输出应包含各库的版本信息且无报错提示。
5. 常见问题解答
Q:无法识别 conda 命令?
A:请务必使用 Anaconda Prompt 执行命令,而非系统自带的 CMD 终端。
Q:PyTorch 安装失败怎么办?
A:若 GPU 版本安装失败,可能与当前 Python 版本不兼容。建议尝试升级至 Python 3.10:
conda install python=3.10 -y
如仍存在问题,可改用 CPU-only 版本进行安装:
conda install pytorch==2.2.2 torchvision torchaudio cpuonly -c pytorch
Q:Jupyter Notebook 启动失败或页面无法打开?
A:可能是默认端口被占用,可尝试更换端口号启动:
jupyter notebook --port=8890