Python面试数据分析,爬虫和深度学习一般都问什么问题,笔试题目有哪些?

Python035

Python面试数据分析,爬虫和深度学习一般都问什么问题,笔试题目有哪些?,第1张

简单罗列些:

1.数据清洗与处理:数据读取read_csv等,数据表构建dataframe等,数据整合concat/join/merge等,表结构处理以及切片iloc/loc等,数据统计describe/isnull/sum/apply等,图表展示plot,数据透视表pivot_table等,异常值与缺失数据统计与处理,相关性检验

2.机器学习模型构建:svm,logistic,knn等

3.爬虫:request包

4.深度学习:CNN,RNN,图像处理,音频处理,语义理解。

我们在会碰到各种各样的面试,有的甚至是HR专门为你设置的障碍,在python面试中也是,无论你是应聘Python web开发,爬虫工程师,或是数据分析,还是自动化运维,这些python面试基础题十大陷阱也许你会遇到,今天的python培训总结出来给你以防万一:

问题1:请问如何修改以下Python代码,使得下面的代码调用类A的show方法?

class A(object)

def show(self):

print 'derived show'

class B(A)

def show(self):

print 'derived show'

obj=B()

obj.show()

答:这道题的考点是类继承,只要通过__class__ 方法指定类对象就可以了。补充的代码如下:

obj._class_=A

obj.show()

问题2:请问如何修改以下Python代码,使得代码能够运行?

class A(object):

def _init_ (self,a,b):

self._a = a

self._b = b

def myprint(self):

print 'a=',self._a,'b=',self._b

a1=A(10,20)

a1.myprint()

a1=(80)

答:此题考察得是方法对象,为了能让对象实例能被直接调用,需要实现 __call__ 方法,补充代码如下:

class A(object):

def _init_ (self,a,b):

self._a = a

self._b = b

def myprint(self):

print 'a=',self._a,'b=',self._b

def_call_(self,num):

print'call:',num+self._a

问题3:下面这段代码的输出是什么?

class B(object):

def fn(self):

print"B fn"

def_init_(self):

print"B INIT"

class A(object):

def fn(self):

print"A fn"

def_new_(cls,a):

print"NEW",a

if a>10:

return super(A,cls)._new_(cls)

return B()

def_init_(self,a):

print "INIT",a

a1=A(5)

a1,fn()

a2=A(20)

a2,fn()

答:

NEW 5

B INIT

B fn

NEW 20

INIT 20

A fn

此题考察的是new和init的用法,使用 __new__ 方法,可以决定返回那个对象,也就是创建对象之前调用的,这个常见于于设计模式的单例、工厂模式。__init__ 是创建对象是调用的。

问题4:下面这段代码输出什么?

1s=[1,2,3,4]

list1 =[i for i in ls if i>2

print list1

list2 =[1*2 for i in ls if 1>2

print list2

dicl={x: x**2 for x in(2, 4, 6)}

print dic1

dic2={x: ' item'+ str(x**2)for x in (2, 4, 6)}

print dic2

setl ={x for x in 'hello world' if x not in 'low level'}

print set1

答:

[3,4]

[6,8]

{2:4,4:16,6:36}

{2:'item4',4:'item16’,6:'item36"}set(["h",'r','d"])

此题考察的是列表和字典的生成。

问题5:下面这段代码输出什么?

num= 9

def f1():

um=20

def f2():

print num

f2()

f1()

f2()

答:

9

9

此题考察全局变量和局部变量。num 不是个全局变量,所以每个函数都得到了自己的 num 拷贝,如果你想修改 num ,则必须用 global 关键字声明。比如下面这样

num=9

def f1():

global num

um=20

def f2():

print num

f2()

f1()

f2()

#prints:

#9

#20

问题6:如何使用一行代码交换两个变量值?

a=8

b=9

答:

(a,b)=(b,a)

问题7:如何添加代码,使得没有定义的方法都调用mydefault方法?

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self):

print'default'

a1=A(10,20)

a1.fn1()

a1.fn2()

a1.fn3()

答:

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self):

print'default'

def_getattr_(self,name):

return self.mydefault

a1=A(10,20)

a1.fn1()

a1.fn2()

a1.fn3()

此题的考的是Python的默认方法, 只有当没有定义的方法调用时,才会调用方法 __getattr__。当 fn1 方法传入参数时,我们可以给 mydefault 方法增加一个 *args 不定参数来兼容。

class A(object):

def_init_(self,a,b):

self.a1=a

self.b1=b

print'init'

def mydefault(self,*args):

print'default:'+str(args[0])

def_getattr_(self,name):

print"other fn:",name

return self.mydefault

a1=A(10,20)

a1.fn1(33)

a1.fn2('hello')

a1.fn3(10)

问题8:一个包里有三个模块,mod1.py , mod2.py , mod3.py ,但使用 from demopack import * 导入模块时,如何保证只有 mod1 、 mod3 被导入了。

答:在包中增加 __init__.py 文件,并在文件中增加:

_all_=['mod1','mod3']

问题9:写一个函数,接收整数参数 n ,返回一个函数,函数返回n和参数的积。

答:

def mulby(num):

def gn(val):

return num*val

return gn

zw=mulby(7)

print(zw(9))

问题10:请问下面的代码有什么隐患?(Python2中)

def strtest1(num):

str='first'

for i in range(num):

str+="X"

return str

答:由于变量str是个不可变对象,每次迭代,python都会生成新的str对象来存储新的字符串,num越大,创建的str对象越多,内存消耗越大。

1. 理论知识(概率统计、概率分析等)

掌握与数据分析相关的算法是算法工程师必备的能力,如果你面试的是和算法相关的工作,那么面试官一定会问你和算法相关的问题。比如常用的数据挖掘算法都有哪些,EM 算法和 K-Means 算法的区别和相同之处有哪些等。

有些分析师的工作还需要有一定的数学基础,比如概率论与数理统计,最优化原理等。这些知识在算法优化中会用到。

除此以外,一些数据工程师的工作更偏向于前期的数据预处理,比如 ETL 工程师。这个职位考察你对数据清洗、数据集成的能力。虽然它们不是数据分析的“炼金”环节,却在数据分析过程中占了 80% 的时间。

2. 具体工具(sklearn、Python、Numpy、Pandas 等)

工程师一定需要掌握工具,你通常可以从 JD 中了解一家公司采用的工具有哪些。如果你做的是和算法相关的工作,最好还是掌握一门语言,Python 语言最适合不过,还需要对 Python 的工具,比如 Numpy、Pandas、sklearn 有一定的了解。

数据 ETL 工程师还需要掌握 ETL 工具,比如 Kettle。

如果是数据可视化工作,需要掌握数据可视化工具,比如 Python 可视化,Tableau 等。

如果工作和数据采集相关,你也需要掌握数据采集工具,比如 Python 爬虫、八爪鱼。

3. 业务能力(数据思维)

数据分析的本质是要对业务有帮助。因此数据分析有一个很重要的知识点就是用户画像。

用户画像是企业业务中用到比较多的场景,对于数据分析来说,就是对数据进行标签化,实际上这是一种抽象能力。

关于如何准备数据分析师面试,青藤小编就和您分享到这里了。如果您对大数据工程有浓厚的兴趣,希望这篇文章可以为您提供帮助。如果您还想了解更多关于数据分析师、大数据工程师的技巧及素材等内容,可以点击本站的其他文章进行学习。