给大数据分析实习生的面试经验题库

猿友 2020-08-13 16:45:12 浏览数 (4083)
反馈

大数据分析是一个有吸引力的领域。这是有利可图的,您有机会从事有趣的项目,而且您总是在学习新事物。因此,进入大数据分析领域极具竞争力。开始大数据分析事业的最佳方法之一是通过大数据分析实习。

在大数据分析实习生面试题库中,我们将研究所需的一般知识水平,典型面试过程的组成部分以及一些面试问题示例。注意,强调“通用”一词是因为具体情况因公司而异。

大数据分析实习面试会有什么期望?

大数据分析实习面试和专职大数据分析师之间的最大区别在于,通常不会期望您了解有关机器学习或深度学习概念的极其具体的细节。

但是,您将期望拥有能够在其上进行构建的基本构建块-包括PythonRSQL,统计和概率基础 以及 基本的机器学习概念。

Python和R

您应该具有脚本语言(最好是Python或R)的编程经验。如果您是Python程序员,则还应该对流行的库(如Scikit-learn 和 Pandas)有基本的了解 。

(推荐教程:python教程

您应该了解的内容: 您应该知道如何编写基本功能,并对各种数据结构及其用途有基本的了解。您还应该了解Scikit-learn的基本(但仍必不可少)功能,例如test_train_splitStandardScaler。对于Pandas,您应该像使用SQL编写查询那样舒适地操作DataFrame

例如,您可能需要构建一个简单的机器学习模型来预测产品的销售数量。在这种情况下,如果您是Python用户,那么了解Scikit-Learn库将非常有用,因为它已经提供了许多预构建的函数,例如上面提到的那些函数。

如何准备: 尝试在Kaggle上进行大数据分析项目或在Interview Query上进行实地考察,以了解您可能需要完成哪些项目。

为了更好地了解Scikit-Learn,最好使用它构建一个简单的机器学习模型,或者逐步完成其他人已经完成的一些大数据分析项目。

(推荐微课:python3基础微课

最后,尝试在Interview Query上练习Python问题,以了解他们可能会问您什么。

SQL

不会期望您在关系数据库方面有太多的经验,但是至少,您应该了解SQL的工作方式。 如果您正在争取大数据分析师的实习机会,那么您很可能会在拥有大量数据的公司工作。您将需要亲自浏览这些数据来解决问题。

(推荐课程:SQL教程)

您应该了解的内容: 您应该能够编写基本查询,并且应该知道如何使用SQL查询来操纵数据。对于公司而言,将SQL纳入其实际案例研究中非常普遍,因此,您必须非常了解SQL

示例问题

编写一个SQL查询以从Employee 表中获取第二高的薪水 。例如,给定下面的Employee表,查询应返回 200 作为第二高的薪水。如果没有第二高的薪水,则查询应返回 null

  + ---- + ---------- +

  | ID | 薪金|

  + ---- + ---------- +

  | 1 | 100 |

  | 2 | 200 |

  | 3 | 300 |

  + ---- + ---------- +

如何准备: 模式为学习基本SQL提供了很好的资源,可以在这里找到。此外,您还可以在线找到大量的SQL练习问题和练习案例研究。

(推荐微课:SQL微课)

统计与概率

您应该对基本统计数据和概率有所了解 。这些概念是大多数机器学习和大数据分析概念的基础。同样,许多要求大数据分析职位的面试问题都与统计有关。

您应该了解的内容: 您应该对基本概念有扎实的理解,包括但不限于概率基础,概率分布,估计和假设检验。统计数据的一个非常普遍的应用是条件概率,例如,假设客户购买了产品C,那么购买该产品B的概率是多少?

如何准备: 如果您对这些概念感到陌生,则可以利用许多免费资源,例如Khan AcademyGeorgia Institute of Technology

机器学习概念

虽然不希望您成为专家,但是您应该对基本的机器学习模型和概念有很好的了解 。如果职位描述表明您将要构建模型,则尤其如此。

您应该了解的内容: 这包括但不限于线性回归,支持向量机和聚类之类的概念。理想情况下,您应该对这些概念有基本的了解,并了解何时适合使用各种机器学习方法。

  例如,您可能需要对产品的价格点实施线性回归以确定销售数量。话虽如此,您将不需要生产或部署机器学习模型作为实习生。

领域知识

您应该对 所申请的领域具有 领域知识(如果没有,则应该学习)。

例如,如果您要申请市场营销部门的大数据分析职位,那么了解不同的营销渠道(例如社交媒体,会员,电视)以及核心指标(例如LTV, CAC)。

大数据分析实习面试流程

同样,面试过程最终取决于您所申请的公司。但是一般来说,大多数(如果不是全部)公司在面试过程中都有一些一般步骤,我将在下面进行解释。

作为实习生, 最糟糕的事情是不对公司的工作进行研究 ,这是文化使命和价值观。

初步筛选

通常,由公司的招聘人员或招聘经理进行初步筛选(通常是电话筛选)。这样做的目的是为了使受访者更好地了解其角色,并使访问者更好地了解受访者。

您应该期望他们询问您对这个职位和公司的兴趣,为什么认为自己很合适,以及与您过去的经历有关的问题。在极少数情况下,您可能还会被问到一个或两个简单的技术问题。

面试官只是在确保您对公司真正感兴趣,您是一个很好的沟通者,并且没有提出任何危险信号。

带回家的情况

对于现在的许多大数据分析实习,公司将要求您完成一项实战挑战。这意味着他们会给您一定的时间来完成他们给您的案例研究,这通常反映出您在实际角色中会遇到的问题。

这样做是为了了解您如何解决问题(即思考过程),以及您是否具有完成问题所需的基本知识。案例的示例包括 清理数据集 并 建立机器学习模型以做出给定的预测或查询数据集并分析数据或两者结合。

现场采访

最后是现场采访,可以包括一轮到多达六轮的采访。这些面试由行为和技术面试问题组成。您可能还需要现场完成一轮案件。

当他们试图确保您对成功担任该角色所需的基本知识有深刻的了解时,他们还将评估您的行为动机,并最终评估您是否适合团队或不。确保您处于最佳行为状态,但不要忘记做自己!

面试问题

以下是您希望了解的一些面试问题的几个示例:

  1)什么是p值?

  2)什么是正则化,它试图解决什么问题?

  3)您如何将年龄和收入之间的关系转换成线性模型?

  4)如果您有两个相等重量的骰子,总和为4的概率是多少?

  5)在整理和清理数据集时需要采取哪些步骤?

  6)什么是交叉验证,为什么有必要?

  7)举例说明在确定机器学习模型有效性时,准确性不是最佳指标。

  8)INNEROUTER JOIN有什么区别?

以上就是关于大数据大数据分析实习生的面试经验题库的相关介绍了,希望对大家有所帮助。

0 人点赞