Python面试数据分析，爬虫和深度学习一般都问什么问题，笔试题目有哪些？

2023-02-24 08:44:02Python035

Python面试数据分析，爬虫和深度学习一般都问什么问题，笔试题目有哪些？,第1张

简单罗列些:

1.数据清洗与处理:数据读取read_csv等，数据表构建dataframe等，数据整合concat/join/merge等，表结构处理以及切片iloc/loc等，数据统计describe/isnull/sum/apply等，图表展示plot，数据透视表pivot_table等，异常值与缺失数据统计与处理，相关性检验

2.机器学习模型构建:svm,logistic,knn等

3.爬虫:request包

4.深度学习:CNN,RNN，图像处理，音频处理，语义理解。

我们在会碰到各种各样的面试，有的甚至是HR专门为你设置的障碍，在python面试中也是，无论你是应聘Python web开发，爬虫工程师，或是数据分析，还是自动化运维，这些python面试基础题十大陷阱也许你会遇到，今天的python培训总结出来给你以防万一：

问题1：请问如何修改以下Python代码，使得下面的代码调用类A的show方法?

class A(object)

def show(self):

print 'derived show'

class B(A)

def show(self):

print 'derived show'

obj=B()

obj.show()

答：这道题的考点是类继承，只要通过__class__ 方法指定类对象就可以了。补充的代码如下：

obj._class_=A

obj.show()

问题2：请问如何修改以下Python代码，使得代码能够运行?

class A(object):

def _init_ (self,a,b):

self._a = a

self._b = b

def myprint(self):

print 'a=',self._a,'b=',self._b

a1=A(10,20)

a1.myprint()

a1=(80)

答：此题考察得是方法对象，为了能让对象实例能被直接调用，需要实现 __call__ 方法，补充代码如下：

class A(object):

def _init_ (self,a,b):

self._a = a

self._b = b

def myprint(self):

print 'a=',self._a,'b=',self._b

def_call_(self,num):

print'call:',num+self._a

问题3：下面这段代码的输出是什么?

class B(object):

def fn(self):

print"B fn"

def_init_(self):

print"B INIT"

class A(object):

def fn(self):

print"A fn"

def_new_(cls,a):

print"NEW",a

if a>10:

return super(A,cls)._new_(cls)

return B()

def_init_(self,a):

print "INIT",a

a1=A(5)

a1,fn()

a2=A(20)

a2,fn()

答：

NEW 5

B INIT

B fn

NEW 20

INIT 20

A fn

此题考察的是new和init的用法，使用 __new__ 方法，可以决定返回那个对象，也就是创建对象之前调用的，这个常见于于设计模式的单例、工厂模式。__init__ 是创建对象是调用的。

问题4：下面这段代码输出什么?

1s=[1,2,3,4]

list1 =[i for i in ls if i>2

print list1

list2 =[1*2 for i in ls if 1>2

print list2

dicl={x: x**2 for x in(2, 4, 6)}

print dic1

dic2={x: ' item'+ str(x**2)for x in (2, 4, 6)}

print dic2

setl ={x for x in 'hello world' if x not in 'low level'}

print set1

答:

[3,4]

[6,8]

{2:4,4:16,6:36}

{2:'item4',4:'item16’,6:'item36"}set(["h",'r','d"])

此题考察的是列表和字典的生成。

问题5：下面这段代码输出什么?

num= 9

def f1():

um=20

def f2():

print num

f2()

f1()

f2()

答:

此题考察全局变量和局部变量。num 不是个全局变量，所以每个函数都得到了自己的 num 拷贝，如果你想修改 num ，则必须用 global 关键字声明。比如下面这样

num=9

def f1():

global num

um=20

def f2():

print num

f2()

f1()

f2()

#prints:

#20

问题6：如何使用一行代码交换两个变量值?

a=8

b=9

答：

(a,b)=(b,a)

问题7：如何添加代码，使得没有定义的方法都调用mydefault方法?

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self):

print'default'

a1=A(10,20)

a1.fn1()

a1.fn2()

a1.fn3()

答：

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self):

print'default'

def_getattr_(self,name):

return self.mydefault

a1=A(10,20)

a1.fn1()

a1.fn2()

a1.fn3()

此题的考的是Python的默认方法，只有当没有定义的方法调用时，才会调用方法 __getattr__。当 fn1 方法传入参数时，我们可以给 mydefault 方法增加一个 *args 不定参数来兼容。

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self,*args):

print'default:'+str(args[0])

def_getattr_(self,name):

print"other fn:",name

return self.mydefault

a1=A(10,20)

a1.fn1(33)

a1.fn2('hello')

a1.fn3(10)

问题8：一个包里有三个模块，mod1.py , mod2.py , mod3.py ，但使用 from demopack import * 导入模块时，如何保证只有 mod1 、 mod3 被导入了。

答:在包中增加 __init__.py 文件，并在文件中增加：

_all_=['mod1','mod3']

问题9：写一个函数，接收整数参数 n ，返回一个函数，函数返回n和参数的积。

答:

def mulby(num):

def gn(val):

return num*val

return gn

zw=mulby(7)

print(zw(9))

问题10：请问下面的代码有什么隐患?(Python2中)

def strtest1(num):

str='first'

for i in range(num):

str+="X"

return str

答：由于变量str是个不可变对象，每次迭代，python都会生成新的str对象来存储新的字符串，num越大，创建的str对象越多，内存消耗越大。

1. 理论知识(概率统计、概率分析等)

掌握与数据分析相关的算法是算法工程师必备的能力，如果你面试的是和算法相关的工作，那么面试官一定会问你和算法相关的问题。比如常用的数据挖掘算法都有哪些，EM 算法和 K-Means 算法的区别和相同之处有哪些等。

有些分析师的工作还需要有一定的数学基础，比如概率论与数理统计，最优化原理等。这些知识在算法优化中会用到。

除此以外，一些数据工程师的工作更偏向于前期的数据预处理，比如 ETL 工程师。这个职位考察你对数据清洗、数据集成的能力。虽然它们不是数据分析的“炼金”环节，却在数据分析过程中占了 80% 的时间。

2. 具体工具(sklearn、Python、Numpy、Pandas 等)

工程师一定需要掌握工具，你通常可以从 JD 中了解一家公司采用的工具有哪些。如果你做的是和算法相关的工作，最好还是掌握一门语言，Python 语言最适合不过，还需要对 Python 的工具，比如 Numpy、Pandas、sklearn 有一定的了解。

数据 ETL 工程师还需要掌握 ETL 工具，比如 Kettle。

如果是数据可视化工作，需要掌握数据可视化工具，比如 Python 可视化，Tableau 等。

如果工作和数据采集相关，你也需要掌握数据采集工具，比如 Python 爬虫、八爪鱼。

3. 业务能力(数据思维)

数据分析的本质是要对业务有帮助。因此数据分析有一个很重要的知识点就是用户画像。

用户画像是企业业务中用到比较多的场景，对于数据分析来说，就是对数据进行标签化，实际上这是一种抽象能力。

关于如何准备数据分析师面试，青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣，希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容，可以点击本站的其他文章进行学习。

数据代码方法的是算法

# 上一篇：如何用r语言绘制多变量散点图

# 下一篇：java 标号 break 自循环

推荐阅读

热门文章

最新发布

标签列表

Python面试数据分析，爬虫和深度学习一般都问什么问题，笔试题目有哪些？

给您推荐相同类型的内容：