全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
233 0
2025-12-01

实验一:平台搭建与环境配置

本实验旨在指导学生在 Windows 操作系统中完成 Python 开发环境的部署,涵盖 Anaconda、PyCharm、Jupyter Notebook 的安装,并配置适用于数据挖掘任务的 Python 3.7 环境。同时,将安装 PyTorch 2.2.2 及其他常用数据分析库。

1. 实验目的

  • 在 Windows 系统上成功部署 Anaconda 及其 Python 运行环境。
  • 创建独立的 Python 虚拟环境 DM(基于 Python 3.7),用于隔离项目依赖。
  • 安装并配置集成开发工具 PyCharm 与交互式笔记本 Jupyter Notebook。
  • 掌握使用 conda 和 pip 进行包管理的基本操作。
  • 安装深度学习框架 PyTorch 2.2.2 以及数据处理相关库。

2. 系统与资源要求

  • 操作系统:Windows 10 或 Windows 11
  • 网络连接:稳定的互联网接入
  • 软件需求:Anaconda 最新版、PyCharm Community/Professional 版本
  • 磁盘空间:至少保留 10 GB 可用空间

3. 安装步骤

3.1 Anaconda 的安装

  1. 访问 Anaconda 官方网站,下载适用于 Windows 的安装程序。
  2. 双击安装文件,按照默认选项逐步完成安装流程。
  3. 安装完成后,启动 Anaconda Prompt,输入以下命令验证安装是否成功:
conda --version
conda --version

3.2 创建独立环境 DM (Python 3.7)

在终端中执行如下命令创建专用于数据挖掘的虚拟环境:

conda create -n DM python=3.7 -y

激活该环境:

conda activate DM
# 创建名为 DM 的 Python 3.7 环境
conda create -n DM python=3.7 -y

# 激活环境
conda activate DM

# 查看已有环境
conda env list

3.3 Jupyter Notebook 安装与启动

在已激活的 DM 环境中运行以下命令安装 Jupyter:

conda install jupyter -y

安装完成后,通过以下命令启动服务:

jupyter notebook
jupyter notebook

若浏览器自动打开 Jupyter 主界面,则表示安装和启动成功。

3.4 PyCharm 配置

  1. 从 JetBrains 官网获取并安装 PyCharm。
  2. 启动 PyCharm,进入项目设置路径:File → Settings → Project → Python Interpreter
  3. 点击解释器配置区域的“Add Interpreter” → 选择“Conda Environment” → 使用已有环境(Existing Environment)。
  4. 指定 Conda 环境路径,确保指向 DM 环境中的 Python 解释器。
<Anaconda路径>\Scripts\conda.exe

3.5 PyTorch 2.2.2 安装

根据硬件支持情况选择合适的安装方式:

CPU 版本安装命令:

conda install pytorch==2.2.2 torchvision torchaudio cpuonly -c pytorch -y

GPU 版本安装命令(以 CUDA 11.8 为例):

conda install pytorch==2.2.2 torchvision torchaudio cudatoolkit=11.8 -c pytorch -y

安装后可通过以下命令验证 PyTorch 是否正确加载:

python -c "import torch; print(torch.__version__, torch.cuda.is_available())"

3.6 常用数据科学库安装

推荐优先使用 conda 安装以下核心库:

conda install numpy pandas matplotlib seaborn scikit-learn scipy -y

补充安装 UMAP 工具包:

conda install -c conda-forge umap-learn -y

对于 conda 不提供的库,可使用 pip 安装:

pip install h5py mygene tensorflow

4. 环境验证

在 Jupyter Notebook 或任意 Python 运行环境中执行以下代码段,确认各组件正常工作:

import sys
import torch
import numpy as np

print("Python:", sys.version)
print("PyTorch:", torch.__version__)
print("CUDA Available:", torch.cuda.is_available())
print("NumPy:", np.__version__)

预期输出应包含各库的版本信息且无报错提示。

5. 常见问题解答

Q:无法识别 conda 命令?
A:请务必使用 Anaconda Prompt 执行命令,而非系统自带的 CMD 终端。

Q:PyTorch 安装失败怎么办?
A:若 GPU 版本安装失败,可能与当前 Python 版本不兼容。建议尝试升级至 Python 3.10:

conda install python=3.10 -y

如仍存在问题,可改用 CPU-only 版本进行安装:

conda install pytorch==2.2.2 torchvision torchaudio cpuonly -c pytorch

Q:Jupyter Notebook 启动失败或页面无法打开?
A:可能是默认端口被占用,可尝试更换端口号启动:

jupyter notebook --port=8890
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群