# Python数据分析
by [@梁斌](http://csusap.csu.edu.au/~bliang03/)
[课件下载](./python_data_analysis_slides.pdf)
部分内容整理自互联网,感谢众多同学的分享。
## 1. 课程介绍
针对科学计算领域的Python开源库生态系统在过去十几年中得到了飞速发展。本项目主要介绍如何利用Python进行数据控制、处理、整理、分析等方面的基本要点,包括用于高效解决各种数据分析问题的Python语言和库。希望让大家能了解如何运用Python进行数据分析,并能在随后的实际项目中将这里所介绍的工具高效地运用。
## 2. 预备知识
### 2.1 Python安装
* [Python官方下载](https://www.python.org/downloads/)
* [ANACONDA下载](https://www.continuum.io/downloads)
### 2.2 编程环境(IDE)
* [PyCharm](https://www.jetbrains.com/pycharm/) 或
* Eclipse + PyDev ([Eclipse下载](https://eclipse.org/downloads/), [PyDev下载](https://marketplace.eclipse.org/content/pydev-python-ide-eclipse)) 或
* [IPython](https://ipython.org/) 或
* 其他...
### 2.3 Python基础知识
* [Python2.7官方文档](https://docs.python.org/2.7/tutorial/)
* [Python教程资料总结](https://wiki.python.org/moin/BeginnersGuide/Programmers)
### 2.4 常用的数据分析Python库
* [NumPy](http://www.numpy.org/)(Numerical Python),Python科学计算的基础包。
* [SciPy](https://www.scipy.org/)(Scientific Python),一款方便、易于使用、转为科学和工程设计的Python工具包。
* [Matplotlib](http://matplotlib.org/),Python著名的绘图库。
* [Pandas](http://pandas.pydata.org/)(Python Data Analysis Library),基于Numpy构建的含有更高级数据结构和工具的数据分析包。
* [Scikit Learn](http://scikit-learn.org/),基于Python的机器学习模块。
## 3. 案例讲解
### 3.1 案例说明
* 1880-2014年间全美婴儿姓名分析
* [项目地址](https://www.kaggle.com/kaggle/us-baby-names)
### 3.2 代码讲解
* [数据概述](./data_overview.ipynb)
* [美剧对婴儿姓名的影响](./tv_inspired_baby_names.ipynb)