二金 加州大学伯克利分校·2022届
APP 内打开
分享
15
18

超级渣硕的数据分析春招历程(附面经)

个人情况

基本情况


双非渣硕,跨专业考的计算机,实验室天坑。选数据分析(偏业务)一方面是个人兴趣,另一方面是被开发和算法劝退……因为我实在是太菜了,代码能力等于0,更别提算法。


能力水平

有过数据分析的相关实习,某电商和某运营商。懂一点点大数据的东西,有一定业务知识,会一些分析工具,完全不懂算法(捂脸……所以走的基本是业务方向的数据分析,经历参考度对偏技术的非常非常有限)


春招情况

各种原因只投了5家,如下表。

公司 进度

虎牙 简历挂

酷狗 简历挂

网易互娱 笔试挂

京东 初试挂

Bigo Offer

面经整理


【】里面是我当时的回答,下同。


Bigo(数据分析实习生)


一面


简单介绍自己

问hive的问题:

(1)union和union all有何不同?

(2)使用union要满足什么条件?

(3)有两个表,join的时候哪个表放在前面更好【小表,让小表先进内存,可以提高效率】

(4)数据倾斜解释一下原理和解决方案【简单解释mapreduce原理,解决方案按参数设置和改写sql代码两方面讲,其中详细举例了我在实习时候遇到的问题】

excel很熟?讲一下vlookup怎么用?

python爬虫是什么情况,用到了什么库【说了爬虫使用的背景,以及这个小爬虫相应的技术】

衍生问题:有做过文本分析吗?貌似想问L1L2正则化的东西。【没有,爬下来的数据相当规整。至于正则化,我记得是机器学习领域的,没学过不好意思……】

python pandas相关问题,dataframe,怎么看数据的大致情况分布等,如最大最小平均四分位置

购物车关联分析怎么回事【说了当时的思路,SQL打标签,下载数据Python处理。关联分析算法是Apriori,但抱歉关联分析代码不是我实现……我搬人家的……在前面加了数据处理的代码】

实习有做过专题分析吗【说大的完整专题分析暂时没有,都是比较细分的点。然后有提及到主要的分析思路,电商业务a. 人货场,b. 转化漏斗】

又看笔试试卷,你没学过概率和机器学习吗,空了这么多?概率是这题公式对,但是算错了。【尴尬……承认不足,的确是没学过算法和没复习好概率】

有做过abtest吗

为什么要跨专业

以后发展方向是什么

对数据分析的理解【主要提到两个点:数据质量,洞察业务】

有什么想问我的吗?【a. 职位属于哪个部门,部门的架构是怎么样的?b. 工作必须用到机器学习方法吗?想了解一下机器学习的落地。c. 业务部门有非常多提数需求,请问如何提高提数效率?】


二面


简单介绍自己(面试官:你说话好快啊)

uv和pv解释?

实习做了什么,有做过专题分析吗

购物篮关联分析

知道怎么用hive抽样吗?比如我想10000条数据的1%【讲了两种方法,order by rand() limit 100,或者用hive的抽样函数tablesample,按分桶和按百分比都有,针对这个可以用百分比方法。】

介绍一下窗口函数,哪种场景用到(笔试的SQL题我写了两种方法,不支持/支持窗口函数的方法)【说到常用的row_number() over()和dense_rank(),也知道sum over()那些但很少用。举了一个实习时提取品类新客的例子,解释了品类新客是什么】

为什么自己要搭hive【认为虽然意向是业务方向,但是由于有非常多的业务需求需要提数,如何写出好的SQL和了解Hive原理使得效率更高非常必要。实习时也有些问题没有解决,想再另外看书学习】

数据分析报告流程?是要怎么出沟通好需求后就开始提数吗?【先沟通好需求,然后拆分需求。在做数据的时候,首先了解数据质量问题,确认数据口径,然后是sql的逻辑,也要知道数据库的坑(举了之前实习中一个例子)。过程中又提到做一次用户画像的统计数据质量造成极大困扰】

(接上了我的回答)如果给到你一份数据,发现很多异常值如何处理?

觉得两段实习哪段对自己提升更大

还面试了哪些公司

有什么要问我的吗


三面


问到自闭,非常怀疑人生……

简单介绍自己

开问概率统计

(1)x^x如何求导

(2)方差如何计算

(3)用python如何计算,有没有简单的方法,不用那么多for循环

(4)提示E(X),方差公式如何写

笔试概率和机器学习空了很多啊,是没学过吗【回答同上,哎】

详细问简历上python爬虫【介绍用到的库和思路等,以及具体的背景】

实习期间,做过业务分析吗,有没有做过什么发现能驱动业务的【我说了一个没写在简历上的分析,解释了业务背景,和大致的结果】

实习期间,看指标觉得什么对用户影响大【我觉得我答偏了,都说到品类对客单价的影响了……】

做过abtest吗?【没有,解释实习所在部门对接的业务,不涉及abtest。另外说了对abtest的理解】

有什么想问吗?【数据分析师的发展路径】


京东(数据分析工程师)

没法现场面,申请了远程。电话面试20min+,已挂。面经没及时整理,不全。


一面


简单介绍自己

问几个Hive的问题

(1) 简要解释MR

(2) 数据倾斜的发生原因

(3) Hive文件类型及其不同点,平时用的哪种文件

(4) Hive的常用参数

学过算法吗?(得到否定的回答后)什么?学计算机的没学过算法?(++尴尬)

估算京东每日订单量【转化漏斗】


职业规划

有什么想问我的吗【a. 所在部门和对接业务,b. 对我面试的评价】

欢聚时代(数据分析实习生,日常实习非暑期)

加一个日常实习的面经,感觉有点借鉴意义。面试官是产品经理。由于是日常实习流程快,一面主管+二面HR,已通过。

你在某电商实习做了什么

你打算毕业做什么

ctr、cvr解释

次日留存、7日留存解释

埋点知道吗?解释一下

(拿出手机打开淘宝)如果你要给淘宝设计埋点,记录看了某个banner的用户,怎么做?【解释以前实习不做产品分析,没做过埋点设计。也讲了自己的理解,对banner编号,记录用户号,看过的banner和顺序,以及每个banner的曝光、停留时间、是否点击】

如果某天的某电商app的dau下降了很多,你怎么分析?【这题答得不好,大概是讲了分地区、分人群去看,以及考虑网络问题???】

如果某天某电商广州销售量下降了很多,你怎么分析?【首先确定数据传输和存储是否有问题,然后看下降的量级,环比同比看下降是否突发还是持续。可以从品类、人群(会员)、流量等方面细看,也要看下转化】

写个sql:有一个表,字段有bannerid、uid、城市,统计广州和珠海bannerid为2的用户数

降序怎么写,随机抽取数据怎么写

左连接和右连接?

某电商什么时候的dau最高?除了活动日,平常日呢?

有什么想问我的?【a. 做这个工作的话,是不是要补充一些产品知识;b. 按照我的面试的情况,请问我还有什么地方需要努力和提高】


总结

春招让我深刻地感受到自己全方位的菜……每次笔试被机器学习数据挖掘算法和概率统计虐成沫,基本每次面试也被质疑为什么没学过算法……(真的不是每个学计算机的都搞AI,身处天坑实验室一声叹息……但这事还是自己的问题。)真的要好好补上算法和复习概率统计啊,留下了没技术的眼泪……

然后是数据分析偏业务方向实习很重要,个人经历每次面试必问在某电商的实习,基本也问得很深。我对业务的了解和一些工具的学习如Hive基本从实习得来,再另外看书深化。

最后,数据分析这岗位真的杂,(从我非常有限的经历)感受到无法预测会笔试考什么,面试问什么……目前看来笔试一般涵盖概率统计、机器学习和数据挖掘算法、SQL编程,另外业务场景题、Linux甚至计算机网络等都有可能出现……面试的话则业务和技术都要准备好,因为无法预测会遇上什么背景的面试官,只能从问题风格推测他/她是偏算法还是偏业务分析的。


发布时间:2020年08月01日
用户头像
我来说两句…
共 15 条评论
苏苏 华东理工大学·2022届
请问楼主在bigo面试体验,对公司的感觉怎么样,马上就要去bigo面试了,求分享点具体经验。
2020年08月19日 回复
红豆浅雪 北京师范大学·2022届
请问楼主,比如“如果某天的某电商app的dau下降了很多,你怎么分析?”这种问题,具体的答题的方法或者思路,是通过什么书还是论坛网站来学的吗,可否分享一下,谢谢!
2020年08月02日 回复
冬夏秋春 吉林大学·2022届
大佬,Hive一定要在Linux系统下使用吗
2020年08月18日 回复
Ashen long 中国矿业大学·2022届
能够私聊嘛,小哥哥,求教一些经验,我也很迷茫呀
2020年08月04日 回复
相思碎 北京航空航天大学·2022届
LZ你好,想请教你在bigo最后一面的一个问题是如何回答的: 实习期间,做过业务分析吗,有没有做过什么发现能驱动业务的 顺便再问我也是在某电商部门实习业务,不知道有没有能提示下平时实习应该注意什么 谢谢
2020年08月08日 回复
田大叔 哥伦比亚大学·2022届
师兄能找你私聊下吗?
2020年08月19日 回复
Silence*缄默 南京信息工程大学·2022届
求问bigo要求什么时候入职
2020年08月18日 回复
诸葛先生 哈尔滨商业大学·2022届
请问做数据分析数据结构需要掌握吗
2020年08月17日 回复
痛风三世 浙江工商大学·2022届
哈哈哈哈哈
2020年08月16日 回复
Ricki 大连海事大学·2022届
请问下运营商的实习你负责的是什么内容
2020年08月14日 回复
Echo 南京理工大学·2022届
求私聊 小哥哥
2020年08月09日 回复
芬仔 上海大学·2022届
楼主SQL到了什么水平啊
2020年08月07日 回复
不爱吃甜的 中国科学技术大学·2022届
顶。
2020年08月07日 回复
一只孤独的程序猿 东华大学·2022届
求问大佬hive的书有安利吗
2020年08月04日 回复
斯巴达克斯 哈尔滨理工大学·2022届
大佬有打比赛/项目吗
2020年08月01日 回复