Scott's Blog

学则不固, 知则不惑

0%

Pandas 安装

这篇文章将带你安装 Python 环境以使用 Pandas。

环境配置

检查是否已安装 Python

检查你的 Python 版本:

  • python --version
  • python -V

检查你的 Python 安装路径(用户):

  • where.exe python

小技巧: 打开你的 PowerShell:

1
2
3
1. 敲击电脑上的 Win 键.
2. 键入 PowerShell.
3. 敲击回车 (Enter)键.

你也可以使用 cmd.exe 或者是 Windows Terminal.

Windows 安装 Python 的几种方式

  • 微软官方商店, 微软公司提供的,主要面向学生与 python 初学者, 公司环境下无法从微软商店下载软件.
  • Windows Subsystem for Linux (WSL), 让你在 Windows 上可以直接运行 Linux, 公司环境下无法配置
  • Python 完整安装包, 推荐.(下载地址)
  • Anaconda, 一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项, 推荐.

推荐使用 Anaconda.

如何安装 Anaconda

  1. 打开安装包

  1. 添加到环境变量

关于安装选项:

  • add Anaconda3 to my PATH environment variable, 会影响其他依赖 python 的软件,根据自己的需要选择
  • Register Anaconda3 as my default Python x, 根据自己的需要选择

关于安装版本, 32 还是 64? 这取决于你机器的处理器的配置, 记住64位机器可以处理32位程序,反之则不行.

Anaconda Windows 官方安装指南

如何管理 Python 运行环境

为什么要管理环境

  • 场景 1: 你的同事给你一份代码, Ta 基于 Python 3.6 写的, Pandas 1.0.1 版本, 你的版本过低或者过高导致无法运行
  • 场景2: 你看到一个不错的 Python 包, 但是安装它会讲你目前的 Pandas 降级, 但是降级又会影响你平时的工作环境
  • 场景3: 你需要部署你的工具,你想创建一个完全干净的环境来测试部署流程, 测试程序依赖的包是否可以工作

管理环境的工具

Python Version Dependency Management Virtual Environment Environment Reproducibility
pyenv
venv + pip
venv + pip-tools
Poetry
Pipenv
Docker
Conda

使用 Conda

对于开发者来说, 电脑上有时候需要有多个 python 环境, 可以使用 Conda 进行来管理 Python 的环境与包, Conda 可以帮你创建、复制、克隆、管理一个全新隔离的环境, 同时也可以用来安装包, 它既具有pip的包管理能力,同时也具有vitualenv的环境管理功能 ,因此在功能上Conda可以看作是pip 和 vitualenv 的组合。

参考 Conda CheatSheet

如何安装 Python 包

Python 装包的选择

  • pip
  • conda
  • 其他略过

区别是什么?

  • 包仓库不同, pip 可以找到, conda 不一定有
  • Pip安装Python包,而conda安装包可能包含用任何语言编写的软件的包
  • conda 会帮你解决包之间的依赖冲突
  • 从使用角度来说, conda 比较慢 (可以考虑 Mamba, 一个旨在替代 Conda 的工具)

使用 Conda

  • 搜索包: conda search PACKAGENAME
  • 安装包: conda install PACKAGENAME
  • 更新包: conda update PACKAGENAME
  • 查看已安装的包: conda list
  • 卸载包: conda remove PACKAGENAME

使用 Pip

  • 搜索包: pip search, currently disabled
  • 安装包: pip install PACKAGENAME
  • 更新包: pip install --upgrade PACKAGENAME
  • 查看已安装包: pip list
  • 卸载包: pip uninstall PACKAGENAME

在 NielsenIQ 装包

  • 因为众所周知的原因, 国内外网经常抽风,而 pip 和 conda 下载包默认都是从国外的服务器下载
  • 为了解决这个问题,国内有一些高等院校和知名企业免费托管了很多包资源,只需要将下载服务器更改为国内地址即可加速包的下载
  • 可以使用清华大学开源软件镜像站来加速, 你也可以使用其他的镜像站

在哪里编写代码?

IDEs 还是代码编辑器?

IDE (or Integrated Development Environment) 是一个专注于软件开发的程序, 它通常包含了许多软件开发的工具集, 例如:

  • 处理代码的编辑器(如高亮代码, 自动补全)
  • 编译、执行, debug 工具
  • 或有版本控制的工具
  • 大部分IDE支持多种语言, 或是拥有更多的功能(也有专门为某种语言开发的IDE, 如针对 Golang 的 Goland, Python 的 Pycharm)

代码编辑器或者说文本编辑器, 大部分都有代码高亮、格式化的功能, 一些优秀的代码编辑器还可以通过插件实现版本控制、多种语言的支持.

常用 IDEs 和代码编辑器

IDEs: - Visual Studio, 微软开发的 IDEs, 特性丰富 - Eclipse + PyDev, 知名 java 编辑器 Eclipse 针对 Python 出的版本

代码编辑器: - Sublime Text, Google 工程师开发的梦想中的编辑器 - Visual Studio Code - Atom, 全平台支持的代码编辑器 - GNU Emacs, Vi / Vim

针对 Python 的 IDEs:

  • PyCharm, 最优秀的 Python IDE 之一, 有付费版和社区免费版
  • Spyder, 为 data science 工作流程优化的 IDE, Anaconda 附带.
  • Thonny, 为初学者准备的 IDE

使用 VS Code

  • 微软为 VS Code 提供了官方的 Python 工具包
  • VS Code 也支持编辑 Jupyter-Notebook
  • 丰富的插件,让你可以许多可定制化的功能,如支持 Git 版本控制、远程编辑服务器上的文件、Debug Jupyter-Notebook 的代码等

使用 Jupyter Notebook & Lab

介绍:

  • Jupyter Notebook 交互式笔记本,支持运行40 多种编程语言,代码基于 Cell 组织,按 Cell 运行,所见即所得,主要用户是数据科学家
  • Jupiter lab 在 Notebook 的基础上,拥有更灵活的布局、可拖动的 Cell、跨 Notebook 之间的编辑,集成终端等丰富的功能

启动:

  • 直接通过应用程序中的 jupyter notebook 打开,默认工作目录是 用户主目录/
  • 若需指定工作目录,可以打开 Powershell,切换到你的目标工作目录,再输入 jupyter-notebook 并回车(jupyter-lab 同理)
  • 若提示 port error,需指定端口,如 jupyter-notebook --port 8889
  • Jupyter 的工作环境可以在你使用 Conda 创建的环境中切换