1 Python 做数据分析有何优势

  • 3806
请先 登录 后评论

1 个回答

XY - 开发者 @ 学研谷
擅长:LS-DYNA,AUTODYN

对比传统的一些数据分析软件,用 Python 做数据分析有这样几个明显的特点:

  • 相比 Excel,Python 能够处理更大的数据集;能够更容易的实现自动化分析;能够比较容易的建立复杂的机器学习模型;
  • 相比 SPSS,SPSS 是个统计软件,只适合在科学研究领域做实验数据的分析,并不适合做偏向实际应用场景的数据的分析;而 Python 能够处理复杂的数据逻辑,适合这些场景;
  • 相比 R 语言,Python 的机器学习库只有一个—sklearn,所有的机器学习方法都集中在这一个库中,而 R 语言,我不清楚它到底有多少个用来做机器学习的库,R 语言中的机器学习方法是如此的分散,以至于很难掌握。而且 Python 的使用人数在不断上升,有一些曾经只使用 R 的人在转向 Python,我自己开始学的也是 R,最后也学了 Python。投入到一个呈现上升趋势的技术中,未来才会更加宽广。
  • 相比上述的几个工具,Python 在做机器学习,网络爬虫,大数据分析时更加的得心应手。

得益于 Python 丰富的第三方库,Python 在数据分析方面,能够处理的问题非常之广,从 Excel 比较擅长的公式计算,数据透视分析,到 MATLAB 比较擅长的科学计算,再到 R 语言中那些零散的机器学习库所能做的事情,Python 都能优雅从容的面对。而这些工具不擅长的网络爬虫,大数据分析(结合 spark),Python 更是能够出色的完成。Python 的数据科学生态包括 Web 开发,数据分析,机器学习,统计分析,科学计算,和分布式系统(大数据分析)方面的组件,相当完善。

请先 登录 后评论