这是简易数据分析系列的第 1 篇文章。


原文首发于博客园:简易数据分析 01


为什么叫简易数据分析


第 1 个原因是本教程面向纯小白用户,不写代码不写公式,迈出数据分析的第一步。


第 2 个原因是生活中很多的数据分析场合,都是很轻量的,不需要上 Python 爬虫、高并发架构,机器学习等重武器,一个浏览器再加一个 Excel 就足够了:


比如说某门课程论文交稿只有几天了,急需快速爬取数据进行数据分析,这时候临阵磨枪学习 Python 爬虫知识时间完全不够;做一些市场调研和运营工作需要对数据进行采集,让技术部门支持的话,走流程的周期过长,不如撸起袖子自己做;工作跳槽,想知道市场上的技能要求和薪资分布,需要采集数据并分析市场需求;…...


这些都是生活中会遇到的问题,面对这些数据量不大(100~10000)的分析需求,非互联网技术人士去学习一些编程知识其实性价比并不高。我们不如利用手头最常见的工具——Excel 和 浏览器,去分析去梳理数据,辅助进行思考和更好的决策。


这也算本门教程的目的——用 20% 的精力解决 80% 的数据分析需求,解放个人的生产力。


本教程主要会从三个方向上进行延伸:数据采集,数据清洗和数据可视化


数据采集,就是利用爬虫软件从互联网上爬取想要数据,然后存储到本地;


数据清洗,就是对收集到的数据做一些格式化的处理,利于后续分析;


数据可视化,就是采用各种各样分析手法,对数据进行不同维度的解读,并以图表这种直观的形式表现出来,更好的辅助我们决策;


从下一篇文章开始,我们学习如何从互联网上采集数据。