科技巨头数据科学面试真题你能答出多少?
来自Glassdoor的最新数据可以告诉我们各大科技公司最近在招聘面试时最喜欢向候选人提什么问题。首先有一个令人惋惜的结论:根据统计,几乎所有的公司都有着自己的不同风格。
通用问题
苹果
1、如果你有几百万用户,每个用户都会发生数百笔交易,这些交易存在于数十种产品中。你该如何把这些用户细分成有意义的几类?
微软
1、描述一个你曾经参与的项目,以及它的优点。
2、如何处理具有高基数(high-cardinality)的类属特征?
3、如果想要给 Twitter feed 写 summarize,你要怎么办?
4、在应用机器学习算法之前纠正和清理数据的步骤是什么?
5、 如何测量数据点之间的距离?
6、请定义一下方差。
7、请描述箱形图(box plot)和直方图(histogram)之间的差异,以及它们的用例。
1、你会使用什么功能来为用户构建推荐算法?
Uber
1、选择任何一个你真正喜欢的产品或应用程序,并描述如何改善它。
2、如何在分布中发现异常?
3、如何检查分布中的某个趋势是否是由于异常产生的?
4、如何估算 Uber 对交通和驾驶环境造成的影响?
5、你会考虑用什么指标来跟踪 Uber 付费广告策略在吸引新用户上是否有效?然后,你想用什么办法估算出理想的客户购置成本?
领英(LinkedIn)
1、(对大数据工程师)请解释 REST 是什么。
机器学习问题
谷歌
1、为什么要使用特征选择(feature selection)?
2、如果两个预测变量高度相关,它们对逻辑回归系数的影响是什么?系数的置信区间是什么?
3、高斯混合模型(Gaussian Mixture Model)和 K-Means 之间有什么区别?
4、在K-Means中如何拾取k?
5、你如何知道高斯混合模型是不是适用的?
6、假设聚类模型的标签是已知的,你如何评估模型的性能?
微软
1、你有哪些引以为豪的机器学习项目?
2、随便找一个机器学习算法,然后描述它。
3、请解释 Gradient Boosting 是如何工作的。
4、(对数据挖掘工程师)请解释决策树模型。
5、(对数据挖掘工程师)什么是神经网络?
6、请解释偏差方差权衡(Bias-Variance Tradeoff)。
7、如何处理不平衡二进制分类?
8、L1和L2正则化之间有什么区别?
Uber
1、你会通过哪种特征来预测Uber司机是否会接受订单请求?你会使用哪种监督学习算法来解决这个问题,如何比较算法的结果?
领英
1、点出及描述三种不同的内核函数,在哪些情况下使用哪种?
2、随意解释机器学习里的一种方法。
3、如何应付稀疏数据?
IBM
1、如何防止过拟合(overfitting)?
2、如何处理数据中的离群值?
3、如何评估逻辑回归与简单线性回归模型预测的性能?
4、监督学习和无监督学习有什么区别?
5、什么是交叉验证(cross-validation),为什么要使用它?
6、用于评估预测模型的矩阵的名称是什么?
7、逻辑回归系数和胜算比(Odds Ratio)之间存在什么关系?
8、成分分析(PCA)和线性和二次判别分析(LDA 和 QDA)之间的关系是什么?
9、如果你有一个因变量分类,又有一个连续自变量的混合分类,你将使用什么算法,方法或工具进行分析?
10、(对行业分析师)逻辑与线性回归有什么区别?如何避免局部极小值?
Salesforce
1、你会使用哪些数据和模型来测量损耗/流失?如何测试模型性能?
2、假设我是一名非技术人员,请向我解释一种机器学习算法。
Capital One(一家美国银行)
1、如何构建一个模型来预测信用卡诈骗?
2、如何处理丢失或不良数据?
3、如何从已存在的特征中导出新的特征?
4、如果你试图预测客户的性别,但只有 100 个数据点,可能会出现什么问题?
5、在拥有两年交易历史的情况下,哪些特征可以用来预测信用风险?
6、请设计一个用来下井字棋的人工智能程序。
1、在一副牌中抽取两张,出现同一花色的概率是多少?
IBM
1、什么是 p-value 和置信区间?
Capital One
1、(对数据分析师)如果你有 70 个红色弹珠,绿色和红色弹珠的比例是 2 比 7,有多少绿色弹珠?
2、纽约市的通勤数据看起来应该遵从什么分布?
3、一个骰子,在扔 6 次的情况下出现 1 个 6 的几率,与扔 12 次的情况下出现至少两个 6 的几率,和扔 600 次出现至少 100 次 6 的几率相比哪个大?
Paypal
1、什么是中心极限定理(Central Limit Theorem),如何证明它?它的应用方向是什么?
编程和算法
谷歌
1、(对数据分析师)请写一个程序可以判定二叉树的高度。
微软
1、请创建一个函数检查一个词是否具有回文结构。
1、请构建一个幂集(power set)。
2、请问如何在一个巨大的数据集中找到中值?
1、假设给定两个二进制字符串,写一个函数将它们添加在一起,而不使用任何内置的字符串到 int 转换或解析工具。
例如:如果给函数二进制字符串 100 和 111,它应该返回 1011、你的解决方案的空间和时间复杂性如何?
2、编写一个函数,它接受两个已排序的列表,并在排序列表中返回它们的并集。
【免责声明】本文部分系转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,如涉及作品内容、版权和其它问题,请在30日内与我们联系,我们会予以重改或删除相关文章,以保证您的权益!
Java开发高端课程免费试学
大咖讲师+项目实战全面提升你的职场竞争力
- 海量实战教程
- 1V1答疑解惑
- 行业动态分析
- 大神学习路径图
相关推荐
更多达内就业喜报
更多>Java开班时间
-
北京 丨 11月27日
火速抢座 -
上海 丨 11月27日
火速抢座 -
广州 丨 11月27日
火速抢座 -
兰州 丨 11月27日
火速抢座 -
杭州 丨 11月27日
火速抢座 -
南京 丨 11月27日
火速抢座 -
沈阳 丨 11月27日
火速抢座 -
大连 丨 11月27日
火速抢座 -
长春 丨 11月27日
火速抢座 -
哈尔滨 丨 11月27日
火速抢座 -
济南 丨 11月27日
火速抢座 -
青岛 丨 11月27日
火速抢座 -
烟台 丨 11月27日
火速抢座 -
西安 丨 11月27日
火速抢座 -
天津 丨 11月27日
火速抢座 -
石家庄 丨 11月27日
火速抢座 -
保定 丨 11月27日
火速抢座 -
郑州 丨 11月27日
火速抢座 -
合肥 丨 11月27日
火速抢座 -
太原 丨 11月27日
火速抢座 -
苏州 丨 11月27日
火速抢座 -
武汉 丨 11月27日
火速抢座 -
成都 丨 11月27日
火速抢座 -
重庆 丨 11月27日
火速抢座 -
厦门 丨 11月27日
火速抢座 -
福州 丨 11月27日
火速抢座 -
珠海 丨 11月27日
火速抢座 -
南宁 丨 11月27日
火速抢座 -
东莞 丨 11月27日
火速抢座 -
贵阳 丨 11月27日
火速抢座 -
昆明 丨 11月27日
火速抢座 -
洛阳 丨 11月27日
火速抢座 -
临沂 丨 11月27日
火速抢座 -
潍坊 丨 11月27日
火速抢座 -
运城 丨 11月27日
火速抢座 -
呼和浩特丨11月27日
火速抢座 -
长沙 丨 11月27日
火速抢座 -
南昌 丨 11月27日
火速抢座 -
宁波 丨 11月27日
火速抢座 -
深圳 丨 11月27日
火速抢座 -
大庆 丨 11月27日
火速抢座