任何组织或个人只要抢先一步掌握大数据, 就会奠定至关重要的竞争优势, 就像在小数
据时代占据先机进行数据分析的人能在竞争者中脱颖而出一样。
因此,数据分析师将会成为一个黄金职业。
步骤1 从识别问题开始
一位定量分析师所做的工作始于认识一个问题或决策, 然后才开始解决问题。
如果你不能针对下面的大部分问题给出肯定的回答, 那你的项目可能从一开始就会陷入困境:
- 哪些高管和定量分析项目的成功息息相关?
- 他们是否对存在的问题和问题的解决方案有一个大概的了解?
- 他们是否有能力提供必要的资源? 是否有能力推进定量分析项目成功所必须的业务变革?
- 他们是否都支持在决策制定过程中使用分析和数据?
- 你所推荐的分析案例和交流方式是否与他们常用的思维与决策方式相一致?
- 你是否计划向他们提供定期反馈和阶段性成果报告?
步骤2 回顾之前的问题
一旦问题被识别, 就应该对所有与之相关的之前的发现进行调查。 回顾之前的发现仍然属于分析( 构建问题) 的*阶段中的一个步骤, 因为调查之前的发现能帮助分析师和决策者思考他们想解决的问题到目前为止是如何被构建的, 以及这个问题可能以何种不同的方式被概念化。
你可以尝试问如下问题:
- 你已经很好地构建问题了吗?
- 你是否已经定义了一个清晰的问题或机会来解决企业里非常重要的问题?
- 你是否已经考虑了多种选择方式来解决问题?
- 你是否已经识别出这个问题的利益相关者, 且针对这个问题你已经和这些利益相关者进行了广泛的交流?
- 刚开始时, 你对问题是否有一个较广泛的定义, 到后来缩小到一个需要解决、 需要应用数据以及明确可能出现的结果的非常确切的问题?
步骤3 简化数据模型
" 简化" 是要我们必须舍弃所有非必须的和无关紧要的细节, 并保留*重要的、 *有效的、 *关键的且会造成影响的特征。
每当你建立一个模型时, 都必须是有选择性的。 你必须识别现实世界中与这个模型相关的因素, 并忽略其他不相关的因素。 你必须建立一个简化的模型世界, 它能让你聚焦于当下设法解决的问题。
你可以尝试问如下问题:
- 我们需要同时分析多少变量? 分析一个变量( 单变量模型) 、 两个变量( 双变量模型) 还是三个或更多变量( 多变量模型) 的概率。
- 我们需要得到描述性或推论性问题的答案吗? 描述统计学( Descriptive Statistics) 简单地描述了你拥有的数据, 均值、 中值和标准差是描述统计学的典型案例。
- 在感兴趣的变量中, 什么样的测量水平是可行的?
步骤4 收集与测量数据
测量变量的4种方式为:
二元变量: 这种变量只有两个值, 并且根据统计分析的目的, 通常*好是把它们身上存在或缺失某种东西的值定义为1或0。 这样的例子可以是你要么是女性要么是男性( 没有女
性特征被记录为0, 女性则被记录为1) , 或者你是否是美国公民。
分类( 或者称为名义) 变量: 对于这种变量的值, 存在多种可能的分类, 比如眼睛的颜色、 冰激凌的口味。 因为这些因素很难被转变成增加或减少会产生意义差别的数字, 所以针对分类数据有一类特殊的统计数据。
序变量: 这些变量有一些分配给它们的数字, 并且数字越大就意味着相应的变量存在的越多。 然而, 1和2之间的差别可能与5和6之间的差别不尽相同。
数值( 间隔和比率) 变量: 这些变量拥有标准的数值单位,比如以磅或千克计量的重量, 或以英尺或厘米计量的高度。数值越大就意味着相应的变量存在的越多。 另外, 数值变量
非常适用于像相关分析和回归分析这样的普通统计方法。
步骤5 数据分析
数据分析需要找到恒定的模式; 换言之, 就是蕴含在数据中的变量之间的关系。 当你看到模式浮现出来时, 解释数字就会变得更加容易。 当你从变量中提炼出这些模式时, 解决问题就会变得更加容易。
分析的维度有如下3种:
两个数值型数据变量: 如果你只是想将两件能够进行数值测量的事情联系起来, 那么你很可能想要使用某种类型的相关分析。 这是你可以执行的*简单的统计分析中的一种。
两个或几个类别变量: 如果你正在使用调查数据, 而且你的数据来自名词定类变量( 比如, 男性/女性, 或者青年/中年/老年) , 那么你将需要使用一系列方法来进行分类数据分析。 这种分析类型的结果常常用表格的方式呈现。
两个以上的数值型数据变量: 将相关分析扩展应用到拥有数值型变量的两个以上的变量上就是回归分析。 有时候, 它被称为多元线性回归分析( 因为你使用了多元变量来解释另一
个变量的价值) 或者线性回归分析( 因为变量之间的关系在整个变量范围中保持相似) 。
步骤6 采取行动
你可尝试按照如下的6个维度提供你数据的分析结果:
- 1. 对这个商业问题的理解;
- 2. 如何估量它的商业影响力;
- 3. 哪些数据是可以用的;
- 4. *初的解决方案;
- 5. *终的解决方案;
- 6. 该解决方案的商业影响力。
基于数据、 分析的分析性思维会在商业和社会中扮演越来越重要的角色。 我们需要很多惯于使用分析性思维的管理人员和专业人员,希望你也可以成为数据分析师。