为什么要使用 Python 进行数据分析

许许多多的人(包括我自己)都很容易爱上 Python 这门语言。自从 1991 年诞生以来,Python 现在已经成为最受欢迎的动态编程语言之一,其他还有 Perl、Ruby 等。由于拥有大量的 Web 框架(比如 Rails(Ruby)和 Django(Python),自从 2005 年,使用 Python 和 Ruby 进行网站建设工作非常流行。这些语言常被称作脚本(scripting)语言,因为它们可以用于编写简短而粗糙的小程序(也就是脚本)。我个人并不喜欢“脚本语言”这个术语,因为它好像在说这些语言无法用于构建严谨的软件。在众多解释型语言中,由于各种历史和文化的原因,Python 发展出了一个巨大而活跃的科学计算(scientific computing)社区。在过去的 10 年,Python 从一个边缘或“自担风险”的科学计算语言,成为了数据科学、机器学习、学界和工业界软件开发最重要的语言之一。

attachments-2019-11-gOWvylMT5dc2cc3ceea5b.jpg

在数据分析、交互式计算以及数据可视化方面,Python 将不可避免地与其他开源和商业的领域特定编程语言 / 工具进行对比,如 R、MATLAB、SAS、Stata 等。近年来,由于 Python 的库(例如 Pandas 和 scikit-learn)不断改良,使其成为数据分析任务的一个优选方案。结合其在通用编程方面的强大实力,我们完全可以只使用 Python 这一种语言构建以数据为中心的应用。

1. Python 作为胶水语言

Python 成为成功的科学计算工具的部分原因是,它能够轻松地集成 C、C++ 以及 Fortran 代码。大部分现代计算环境都利用了一些 Fortran 和 C 库来实现线性代数、优选、积分、快速傅里叶变换以及其他诸如此类的算法。许多企业和国家实验室也利用 Python 来“粘合”那些已经用了多年的遗留软件系统。

大多数软件都是由两部分代码组成的:少量需要占用大部分执行时间的代码,以及大量不经常执行的“胶水代码”。大部分情况下,胶水代码的执行时间是微不足道的。开发人员的精力几乎都是花在优化计算瓶颈上面,有时更是直接转用更低级的语言(比如 C)。

  • 发表于 · 2019.11.06 21:36 · 阅读 · 3169

[版权声明] :本文文字、代码及图片版权归原作者所有,任何媒体、网站或个人未经本网协议授权不得采集、整理、转载或以其他方式复制发表。已经本站协议授权的媒体、网站,在使用时必须注明“稿件来源:学研谷”。

0 条评论

请先 登录 后评论
猜猜我是谁
CSUA -研究生

2
提问
55
回答
27
文章