现在有很多做运营的,做内容的经常会因为数据的暴增感到烦恼。因为很多时候他们能拿到的数据又分散又凌乱,难以整理,更难做全局的统计。
数据库跟Excel孰优孰劣?
前一阵子有一个做运营和内容的朋友问我,他们这种职业如何做数据分析。毕竟在数据量非常大的情况下,用Excel似乎不是很现实。一般配置的机器,打开一个70万行M的excel文档,基本卡得没法做运算。更别提透视表操作了。但是数据库不同,万行都只是小意思,后面熟悉了数据库的优化和配置之后,可以轻松玩转0万行以上的数据。而且统计速度都是毫秒级、秒级。
我经常在网络上看到到各种数据分析程序的广告,这种要不要去学呢?
就学习一门编程语言而言,毕竟是一种技能,技多不压身嘛。当然是好事,但小白学习编程语言会是一段很痛苦的经历,也需要投入很多的精力和时间。所以在这个预期下,如果还想学的话,我会说,那还等什么,赶紧着手啊。
但是,很大一部分人会半途而废。因为在工作中已经被摧残得体无完肤的时候,还得抽出来接受编程的摧残,除非真的很感兴趣,当作一种乐趣在做,否则真没几个愿意坚持下去。
在着手学习前,我觉得应该对自己的职业和未来有个预期,比如以后需要处理的数据到达什么量级,如果只是几千行几万行数据,都很少几十万行的话,我觉得精通excel更提升现在的效率;如果动不动就几十万行几百万行上千万行,那么可以去学,当然,最好先学习数据库。然后再根据数据的处理需求来学习编程语言。毕竟数据分析,得先处理数据,才能分析。
新手如何入门数据库?
这里,我先简单讲一数据库的东西。
数据库有很多种类,但都大同小异,可以从简单方便地入手。以MySQL为工具展开学习。整个学习过程分为两大步骤,先学习SQL语法,然后学习用编程语言将数据导入数据库。先学习MySQL,能让你理解自己的需求,可以先知道数据库的使用跟excel有什么区别,有哪些优势。
学数据库,首先需要在系统上装一个数据库,就像用excel得先装office一样。配置数据库是个技术活,小白可以用网络上的集成环境,一键搞定。比如phpStudy。该集成环境中就包含MySQL数据库。教程在phpStudy上也都有。装完数据库,要先装一个数据库的客户端,用于像操作Excel表格一样图形化操作数据库。比如SQLyog。
接下来,我们看看数据库到底是什么样的。以下的内容是基于读者已经初步掌握数据库的基本知识。先看看SQL语句是什么?
(1)获取wordpress数据库中outsite_data这个数据表的所有数据的程序命令:
SELECT*FROMwordpress.outsite_data;
(2)计算wordpress数据库中outsite_data这个数据表中所有id小于的行的state列的累加的程序命令:
SELECTSUM(state)FROMwordpress.outsite_dataWHEREid;
(3)统计wordpress数据库中outsite_data这个数据表中所有id大于的有多少行的程序命令:SELECTCOUNT(*)FROMwordpress.outsite_dataWHEREid;
(4)计算wordpress数据库中outsite_data这个数据表中所有id大于的state列的平均值的程序命令:
SELECTAVG(state)FROMwordpress.outsite_dataWHEREid;
(5)查找title列(标题列)中所有包含python字符串的行。
SELECT*FROMwordpress.outsite_dataWHEREtitleLIKE%python%;
咋看之下,是否会让人觉得,编程也不过如此。
当然,这些不过是最基础的操作,当你学到后期,需要学习更多的语句模式、原理。但是基本格式也是相差无几。只是思考的维度上需要有所提升。
数据库其实不难学,论学习难度的话,我个人觉得跟excel差不多。只是Excel绝大部分都是图形化操作,按个按钮,输入个公式。而数据库绝大部分是用SQL语言来操作。SQL语言的入门也比较简单,基础的操作都是属于记忆型的知识。
学会数据库就是学会数据分析?
当然,就算学会数据库,也不一定就能说学会数据分析。
数据库只是数据存储的载体,SQL语言是在这个载体上进行查询统计的操作。学会了SQL相当于能使用Excel的超强版。怎么从数据里面挖掘出有用的东西,这又是另一门学问了。
比如活跃数量、新增数量、付费额、ROI、ARPU等指标,你单看一天两天的数据没啥用,你需要把这些数据从几个月前到现在都统计好列出来,才能看到它的变化规律和走势,才能个根据这种规律去做运营决策。
数据库这块能做到的,就是将这些数据统计好列出来。它能统计出你想要的各种数据,但依然是表格的形式。
但在的决策单靠表来看数据的话,效率未免低了点。在数据形成了表之后,还需要形成图。想要用折线图、柱状图、饼图、散点图之类的图来直观地展示数据。还需要借助编程语言来实现,比如PHP、Python、Java等。
所以,当你已经掌握了数据库之后,便可以着手学习一门编程语言,可以从PHP和Python中选一门,因为他们都很简单易懂,非常适合初学者。
学会了编程语言,使用编程语言将各种格式的数据导入数据库。比如excel格式的数据,csv格式的数据,网络上用爬虫抓取到的数据等。
在编程技术趋于白热化的互联网时代,编程的学习都开始走进小学课堂。学习和掌握基础的编程技术,也是紧跟时代的步伐。