
撰文/Iris帆
导读
最近面试了3份数据分析工作,本期分享将围绕其中一份工作进行挖掘,谈谈数据分析到底是在分析什么。首先介绍一下我面试的这份工作:来自英国某媒体广告公司,主营金融和教育产品广告,我应聘的岗位是「市场研究分析」。
数据分析——市场方向分析哪些内容?
需要具备的技能和工具有哪些?
首先,从大的背景来看,两份工作所用到的数据都多偏向于维度(类别型,文字类),收集数据的来源也主要是调查问卷。从这一点来看,跟那些有着完善数据收集的大公司比较,着实有点天差地别。
大公司除了可以买第三方数据外,还能用自己的技术收录数据,而中小型正规点的公司都是一步步自己收集,效率跟不上,但确实很用心。老实讲,我很担心中小公司的发展,技术跟不上很容易被淘汰,应当如何求生?当然这不是本期重点,还是来谈职位本身吧!
背景:疫情导致在家办公,群众接触金融产品的途径——印刷报纸受到影响,金融产品公司如何广告增收?
研究:群众接触金融产品的习惯和方式,为金融公司确定产品传播渠道和方式提建议。
解决:调查多少群众因为疫情减少报纸阅读,多少群众愿意转战在线金融会议获取信息,群众对在线金融广告的建议等。

工作任务
数据收集——调查问卷
方向:群众对金融产品了解度调查
方式:主要为电话问卷,线上问卷
设计:自行设计或沿用老的模板
内容:问卷响应者「基本信息」(年龄,地区,职业等),对某金融商品A、B、C的「熟悉度」和「购买欲程度」选择,接触金融商品的「途径」选择,工作方式(在家或办公室办公),接触报纸的方式(公司、家里、报亭),其它反馈等。
数据分析——Excel, Python, R等
结果展示——可视化,仪表盘,ppt展示
结论建议——报告或ppt形式
介绍的其实就是数据分析包含的过程,基本涵盖在一个职位里。
上面的介绍也是我面试过程中得到的一个分析任务(该任务囊括了职位75%的内容),因为全部是文本型的数据,这大大地考验了我的能力。相对于销售额的直接,文本型的分析带有更多主观成分。
因为任务属于开放性的,也就是我可以自行确定我对调查问卷数据表的发现,并通过ppt的形式展示出我的逻辑分析过程和结论。要求就是storytelling故事性的方式展示出,不需要太多技术术语,因为这个研究展示面对的也是没有相关统计和编程技术的人群。
这里我也简单介绍一下完成这个任务,我做了哪些核心的步骤。
我是用Python做了一些简单的数据整理工作,比如缺失值的填充和删除,然后对文本一致性做了处理,表格格式上的修正等等。
接着,在可视化上我没有继续使用Python,而是转战使用了Tableau。Tableau真的是超级方便,满足了我对图表建立的发散,又能帮助我直观地学习图表设计思维。
在做ppt展示的时候,我自行加了一个逻辑流程图帮助理解我最终的分析结论(图1),这个流程图是我最后一面的加分项。

图1
老实说在我拿到任务之后,还是挣扎了好久才有一条清晰的思路,这点也恰巧证实了我逻辑思维的缺陷,表现在无法快速产生前后因果联系。我的一个优点是擅长联系两个事物的关系,但真要解决一个问题或者展现一个流程,两个事物的联系是无法解释全部内容的。
所以通过这次的任务我学到了什么呢?
很重要的一点是我学到了任务究竟是在分析什么。首先没有人告诉你确切的分析点,你需要自行确定,这使得分析范围十分广。但是,通过不同方向的尝试分析,我也在逐步地缩小这个范围,直到最后确定目标。
所以,按范围来说,分析是从「散」到「广」到「小」最后到「确定中心」的过程。
虽然拿到任务后,脑子里没有一个方向,但是也能通过常识判断出一个突破口(只要开始了,就是突破口,管他是什么样的开始)。我拿到数据,判定的一个突破口就是”熟悉金融商品A和B的差异性在哪里,人们更熟悉A还是B商品?(一个扇形或者柱状图就能解决)“就这个口子,我后面又做了一系列的尝试,”在家和在公司办公人数比例“,”人们获取报纸各种途径的比例“等等。
最终我自己发现的故事就是上面图1所表达的流程。金融产品通过报纸这一途径向人们传播概念和销售,而人们获取报纸最多的途径是办公室。因为疫情影响,办公室工作人数急剧降低,这间接影响了人们阅读报纸的频率。金融公司为了稳定自己的业务,需要考虑广告的替代方案。结果显示人们认为在线会议有效提升产品的传播,增加购买的趋势。
我给出的未来研究建议是,扩大数据量,深入挖掘不同层次的趋势(不同地域,不同职业和不同年龄层次的人群);在线广告投放策略的探索。
总的来说本期的分享不是在谈怎么做数据分析,而是谈数据分析到底在分析什么?我最终得出这样的结论:拿到任务你可能已经产生了一种想法(前面说的突破口),跟着这个想法进行可视化图表,再根据图表显示内容进一步缩小或改变范围,直到你自信地发现最终的结果。
当然,这个结论是面向像我一样经验缺乏的数据分析新手。作为新手,最难过的一关就是这个「突破口」,我只能说放心大胆地去做尝试,做迭代。谁能一开始就已经知道结论了呢?那些经验丰富的老手自然能凭着直觉就能有所发现,也能凭着直觉顺滑地理清因果关系,这都是经验积累的结果呢。
千万不要被开始的毫无头绪,手足无措而打败,脑子里有任何想法都用起来,哪怕很幼稚的想法,那都是突破口啊!
最后,今天的分享我没有谈数据处理怎么做,下期分享就来主攻技术这一块。今天的内容还是落在了数据思维上面,任何强大的技能都离不开思维的支持,思维是帮助你从内心层面对这件事产生共鸣呢!多说一句,脑海里能够构建出理解和解决问题的思路,这就是思维,之后要做的就是用技能去实现、去验证你的构想。









