49个python基础面试题的简单介绍

本文目录一览：

1、Python后端工程师面试题目有哪些
2、python面试必备题目有哪些
3、Python面试题，线程与进程的区别，Python中如何创建多线程？
4、快速深入一门语言的几个问题（Python面试题
5、python面试题总结1-内存管理机制
6、python 经典面试题有哪些

Python后端工程师面试题目有哪些

一.语言

1.推荐一本看过最好的python书籍？

2.谈谈python的装饰器，迭代器，yield？

3.标准库线程安全的队列是哪一个？不安全的是哪一个？logging是线程安全的吗？

4.python适合的场景有哪些？当遇到计算密集型任务怎么办？

5.python高并发解决方案？我希望听到twisted-tornado-gevent，能扯到golang,erlang更好

二.操作系统

可以直接认为是linux，毕竟搞后端的多数是和linux打交道。

1.tcp/udp的区别？tcp粘包是怎么回事，如何处理？udp有粘包吗？

2.time_wait是什么情况？出现过多的close_wait可能是什么原因？

3.epoll,select的区别？边缘触发，水平触发区别？

三.存储

存储可能包含rdbms，nosql以及缓存等，我以mysql,redis举例

mysql相关

1.谈谈mysql字符集和排序规则？

2.varchar与char的区别是什么？大小限制？utf8字符集下varchar最多能存多少个字符

3.primary key和unique的区别？

4.外键有什么用，是否该用外键？外键一定需要索引吗？

5.myisam与innodb的区别？innodb的两阶段锁定协议是什么情况？

6.索引有什么用，大致原理是什么？设计索引有什么注意点？

redis相关

1.什么场景用redis，为什么mysql不适合？

2.谈谈redis的事务？用事务模拟原子+1操作？原子操作还有其它解决方案吗？

3.redis内存满了会怎么样？

四.安全

web安全相关

1.sql注入是怎么产生的，如何防止？

2.xss如何预防？htmlescape后能否避免xss?

3.csrf是什么？django是如何防范的？

密码技术

1.什么是分组加密？加密模式有哪些？ecb和cbc模式有什么区别？为什么需要iv向量？

2.简单说说https的过程？

3.对称加密与非对称加密区别？

3.如何生成共享秘钥？如何防范中间人攻击？

五.杂

是否关注新技术啊？golang，rust是否了解？numpy,pandas是啥鸟？

是否紧跟时代潮流？逛不逛微博，刷不刷知乎？

可能你觉得我问的好细，但这好多都是平常经常遇到，并需要解决的，细节更能体现一个人。

如果你觉得小kiss，欢迎投简历给我yihaibo@longtugame.com，龙图游戏运营支持中心数据分析部招人；觉得有点问题，那还等什么，赶快来和我交流交流。

更新:讨论区挺热闹，有人说好简单，有人说好难，其实我觉得这只适合面试2~3年工作经验的后端工程师。真的没有问

很难的题目，只是可能你平时没有注意。

在这里我推荐几本书吧

python参考手册，绝对让你更上一层楼

图解密码技术，密码入门不二之选

mysql技术内幕第五版，有点厚当手册读读，要有耐心，高性能mysql也强烈建议读读

effective tcp/ip programming

为什么评论区有这么大差异？我想是个人经历不一样吧，如果是搞web的对操作系统这块和密码技术会偏弱，但如果是系统工程师或是游戏服务端这块会明显偏强。

六.后记

最近我也面试了不少童鞋，我发现能达到要求的真的少之又少，很多hr都说Python是最难招聘的岗位，我想是有道理的，这真的很值得我们去深思？

我想有一部分原因是Python这门语言造成的，会写Python的人很多，但写的好的人很少，大部分都把Python当做脚本来写，缺乏面向对象，模式的思想。想想Java，大家都习惯了接口，实现分离，设计模式在Java中也喊了很多年，尤其是ssh三大框架一出，用着用着就理所当然的认为就该这么做，虽然也有点坏处，但对企业级Java开发无疑是一大进步。

反观Python，尤其是生成器，协程，元类给Python注入了很大的灵活性，想写的Pythonic有不小难度，但其实Python高级特性就那么几个，干掉了也就没有了。

当你觉得Python遇到了瓶颈，不妨停下来好好想想。研究研究设计模式，想想重构，了解领域驱动设计，敏捷开发，再回来读读以前写的代码，当眼界变高了，代码也就美了。

当然思想的提高不是一朝一夕，模式，原则会经常让你纠结，纠结就会思索，思考就走出了自己的路，当然条条大路通罗马。

数据库等存储技术是研发工程师迈不过的坎，对关系数据库以mysql举例来说，你必须清楚的知道什么字段选择什么类型，类型字节大小，限制条件，这东西也很容易理解，多想想即可，比如set类型，要支持交并等操作，1个字节只能存8个类别。数据类型搞定了，下面就是索引了，mysql索引种类？主键，唯一索引，普通索引。索引类别，BTree索引，hash索引。索引的优缺点，mysql的索引查找原理，join原理(大部分都是nested loop)，以及一些特殊的情况，比如mysql子查询慢等。其实到这里研发工程师就差不多，当然你可以继续深入下去，比如读写分离，集群管理，甚至一些参数调优。

python面试必备题目有哪些

给你一份千锋python的面试题吧

1、多线程使用Python是个好主意吗？列出一些方法可以让一些Python代码以并行方式运行。

答：Python不允许真正意义上的多线程。它有一个多线程包，但如果你想使用多线程来加速你的代码，那么使用它通常不是一个好主意。Python有一个名为全局解释器锁(Global

Interpreter

Lock（GIL）)的结构。GIL确保每次只能执行一个“线程”。一个线程获取GIL，做一点工作，然后将GIL传递到下一个线程。这种情况发生的很快，因此对于人眼看来，你的线程似乎是并行运行的，但它们实际上只是轮流使用相同的CPU核心。所有这些GIL传递都增加了运行的内存。这意味着如果你想让代码运行得更快，那么使用线程包通常不是一个好主意。

使用Python的线程包也是有原因的。如果你想同时运行一些东西，并且效率不是一个问题，那么它就完全没问题了。或者，如果你正在运行需要等待某些事情的代码（例如某些IO），那么它可能会很有意义。但是线程库不会让你使用额外的CPU核心。

多线程可以外包到操作系统（通过多处理），一些调用Python代码的外部应用程序（例如，Spark或Hadoop），或者Python代码调用的一些代码例如：你可以使用你的Python代码调用一个C函数来完成昂贵的多线程事务。

2、这段代码输出了什么：

def f(x,l=[]):for i in range(x):l.append(i*i)print(l) f(2)f(3,[3,2,1])f(3)

答：[0, 1][3, 2, 1, 0, 1, 4][0, 1, 0, 1, 4]

3、如何在Python中管理内存？

Python中的内存管理由Python私有堆空间管理。所有Python对象和数据结构都位于私有堆中。程序员无权访问此私有堆。Python解释器负责处理这个问题。Python对象的堆空间分配由Python的内存管理器完成。核心API提供了一些程序员编写代码的工具Python还有一个内置的垃圾收集器，它可以回收所有未使用的内存，并使其可用于堆空间。

4、range＆xrange有什么区别？

在大多数情况下，xrange和range在功能方面完全相同。它们都提供了一种生成整数列表的方法，唯一的区别是range返回一个Python列表对象，x range返回一个xrange对象。

这就表示xrange实际上在运行时并不是生成静态列表。它使用称为yielding的特殊技术根据需要创建值。该技术与一种称为生成器的对象一起使用。因此如果你有一个非常巨大的列表，那么就要考虑xrange。

5、Python中help()和dir()函数的用法是什么？

Help()和dir()这两个函数都可以从Python解释器直接访问，并用于查看内置函数的合并转储。

help()函数：help()函数用于显示文档字符串，还可以查看与模块，关键字，属性等相关的使用信息。

dir()函数：dir()函数用于显示定义的符号。

6、NumPy中有哪些操作Python列表的函数？

Python的列表是高效的通用容器。它们支持（相当）有效的插入，删除，追加和连接，Python的列表推导使它们易于构造和操作。

它们有一定的局限性：它们不支持像素化加法和乘法等“向量化”操作，并且它们可以包含不同类型的对象这一事实意味着Python必须存储每个元素的类型信息，并且必须执行类型调度代码在对每个元素进行操作时。

NumPy不仅效率更高; 它也更方便。你可以免费获得大量的向量和矩阵运算，这有时可以避免不必要的工作。它们也得到有效实施。

NumPy数组更快，你可以使用NumPy，FFT，卷积，快速搜索，基本统计，线性代数，直方图等内置。

这些内容还是比较重要的，如果有帮到你，麻烦采纳谢谢

Python面试题，线程与进程的区别，Python中如何创建多线程？

进程和线程

这两个概念属于操作系统，我们经常听说，但是可能很少有人会细究它们的含义。对于工程师而言，两者的定义和区别还是很有必要了解清楚的。

首先说进程，进程可以看成是 CPU执行的具体的任务。在操作系统当中，由于CPU的运行速度非常快，要比计算机当中的其他设备要快得多。比如内存、磁盘等等，所以如果CPU一次只执行一个任务，那么会导致CPU大量时间在等待这些设备，这样操作效率很低。为了提升计算机的运行效率，把机器的技能尽可能压榨出来，CPU是轮询工作的。也就是说它一次只执行一个任务，执行一小段碎片时间之后立即切换，去执行其他任务。

所以在早期的单核机器的时候，看起来电脑也是并发工作的。我们可以一边听歌一边上网，也不会觉得卡顿。但实际上，这是CPU轮询的结果。在这个例子当中，听歌的软件和上网的软件对于CPU而言都是独立的进程。我们可以把进程简单地理解成运行的应用，比如在安卓手机里面，一个app启动的时候就会对应系统中的一个进程。当然这种说法不完全准确，一个应用也是可以启动多个进程的。

进程是对应CPU而言的，线程则更多针对的是程序。即使是CPU在执行当前进程的时候，程序运行的任务其实也是有分工的。举个例子，比如听歌软件当中，我们需要显示歌词的字幕，需要播放声音，需要监听用户的行为，比如是否发生了切歌、调节音量等等。所以，我们需要进一步拆分CPU的工作，让它在执行当前进程的时候，继续通过轮询的方式来同时做多件事情。

进程中的任务就是线程，所以从这点上来说，进程和线程是包含关系。一个进程当中可以包含多个线程，对于CPU而言，不能直接执行线程，一个线程一定属于一个进程。所以我们知道，CPU进程切换切换的是执行的应用程序或者是软件，而进程内部的线程切换，切换的是软件当中具体的执行任务。

关于进程和线程有一个经典的模型可以说明它们之间的关系，假设CPU是一家工厂，工厂当中有多个车间。不同的车间对应不同的生产任务，有的车间生产汽车轮胎，有的车间生产汽车骨架。但是工厂的电力是有限的，同时只能满足一个厂房的使用。

为了让大家的进度协调，所以工厂需要轮流提供各个车间的供电。这里的车间对应的就是进程。

一个车间虽然只生产一种产品，但是其中的工序却不止一个。一个车间可能会有好几条流水线，具体的生产任务其实是流水线完成的，每一条流水线对应一个具体执行的任务。但是同样的，车间同一时刻也只能执行一条流水线，所以我们需要车间在这些流水线之间切换供电，让各个流水线生产进度统一。

这里车间里的流水线自然对应的就是线程的概念，这个模型很好地诠释了CPU、进程和线程之间的关系。实际的原理也的确如此，不过CPU中的情况要比现实中的车间复杂得多。因为对于进程和CPU来说，它们面临的局面都是实时变化的。车间当中的流水线是x个，下一刻可能就成了y个。

了解完了线程和进程的概念之后，对于理解电脑的配置也有帮助。比如我们买电脑，经常会碰到一个术语，就是这个电脑的CPU是某某核某某线程的。比如我当年买的第一台笔记本是4核8线程的，这其实是在说这台电脑的CPU有 4个计算核心，但是使用了超线程技术，使得可以把一个物理核心模拟成两个逻辑核心。相当于我们可以用4个核心同时执行8个线程，相当于8个核心同时执行，但其实有4个核心是模拟出来的虚拟核心。

有一个问题是为什么是4核8线程而不是4核8进程呢？因为CPU并不会直接执行进程，而是执行的是进程当中的某一个线程。就好像车间并不能直接生产零件，只有流水线才能生产零件。车间负责的更多是资源的调配，所以教科书里有一句非常经典的话来诠释：进程是资源分配的最小单元，线程是CPU调度的最小单元。

启动线程

Python当中为我们提供了完善的threading库，通过它，我们可以非常方便地创建线程来执行多线程。

首先，我们引入threading中的Thread，这是一个线程的类，我们可以通过创建一个线程的实例来执行多线程。

from threading import Thread t = Thread(target=func, name='therad', args=(x, y)) t.start()

简单解释一下它的用法，我们传入了三个参数，分别是 target，name和args ，从名字上我们就可以猜测出它们的含义。首先是target，它传入的是一个方法，也就是我们希望多线程执行的方法。name是我们为这个新创建的线程起的名字，这个参数可以省略，如果省略的话，系统会为它起一个系统名。当我们执行Python的时候启动的线程名叫MainThread，通过线程的名字我们可以做区分。args是会传递给target这个函数的参数。

我们来举个经典的例子：

import time, threading # 新线程执行的代码: def loop(n): print('thread %s is running...' % threading.current_thread().name) for i in range(n): print('thread %s %s' % (threading.current_thread().name, i)) time.sleep(5) print('thread %s ended.' % threading.current_thread().name) print('thread %s is running...' % threading.current_thread().name) t = threading.Thread(target=loop, name='LoopThread', args=(10, )) t.start() print('thread %s ended.' % threading.current_thread().name)

我们创建了一个非常简单的loop函数，用来执行一个循环来打印数字，我们每次打印一个数字之后这个线程会睡眠5秒钟，所以我们看到的结果应该是每过5秒钟屏幕上多出一行数字。

我们在Jupyter里执行一下：

表面上看这个结果没毛病，但是其实有一个问题，什么问题呢？输出的顺序不太对，为什么我们在打印了第一个数字0之后，主线程就结束了呢？另外一个问题是，既然主线程已经结束了，为什么Python进程没有结束，还在向外打印结果呢？

因为线程之间是独立的，对于主线程而言，它在执行了t.start()之后，并不会停留，而是会一直往下执行一直到结束。如果我们不希望主线程在这个时候结束，而是阻塞等待子线程运行结束之后再继续运行，我们可以在代码当中加上t.join()这一行来实现这点。

t.start() t.join() print('thread %s ended.' % threading.current_thread().name)

join操作可以让主线程在join处挂起等待，直到子线程执行结束之后，再继续往下执行。我们加上了join之后的运行结果是这样的：

这个就是我们预期的样子了，等待子线程执行结束之后再继续。

我们再来看第二个问题，为什么主线程结束的时候，子线程还在继续运行，Python进程没有退出呢？这是因为默认情况下我们创建的都是用户级线程，对于进程而言，会等待所有用户级线程执行结束之后才退出。这里就有了一个问题，那假如我们创建了一个线程尝试从一个接口当中获取数据，由于接口一直没有返回，当前进程岂不是会永远等待下去？

这显然是不合理的，所以为了解决这个问题，我们可以把创建出来的线程设置成守护线程。

守护线程

守护线程即daemon线程，它的英文直译其实是后台驻留程序，所以我们也可以理解成后台线程，这样更方便理解。daemon线程和用户线程级别不同，进程不会主动等待daemon线程的执行，当所有用户级线程执行结束之后即会退出。进程退出时会kill掉所有守护线程。

我们传入daemon=True参数来将创建出来的线程设置成后台线程：

t = threading.Thread(target=loop, name='LoopThread', args=(10, ), daemon=True)

这样我们再执行看到的结果就是这样了：

这里有一点需要注意，如果你在jupyter当中运行是看不到这样的结果的。因为jupyter自身是一个进程，对于jupyter当中的cell而言，它一直是有用户级线程存活的，所以进程不会退出。所以想要看到这样的效果，只能通过命令行执行Python文件。

如果我们想要等待这个子线程结束，就必须通过join方法。另外，为了预防子线程锁死一直无法退出的情况，我们还可以在joih当中设置timeout ，即最长等待时间，当等待时间到达之后，将不再等待。

比如我在join当中设置的timeout等于5时，屏幕上就只会输出5个数字。

另外，如果没有设置成后台线程的话，设置timeout虽然也有用，但是进程仍然会等待所有子线程结束。所以屏幕上的输出结果会是这样的：

虽然主线程继续往下执行并且结束了，但是子线程仍然一直运行，直到子线程也运行结束。

关于join设置timeout这里有一个坑，如果我们只有一个线程要等待还好，如果有多个线程，我们用一个循环将它们设置等待的话。那么主线程一共会等待N * timeout的时间，这里的N是线程的数量。因为每个线程计算是否超时的开始时间是上一个线程超时结束的时间，它会等待所有线程都超时，才会一起终止它们。

比如我这样创建3个线程：

ths = [] for i in range(3): t = threading.Thread(target=loop, name='LoopThread' + str(i), args=(10, ), daemon=True) ths.append(t) for t in ths: t.start() for t in ths: t.join(2)

最后屏幕上输出的结果是这样的：

所有线程都存活了6秒。

总结

在今天的文章当中，我们一起简单了解了操作系统当中线程和进程的概念，以及Python当中如何创建一个线程，以及关于创建线程之后的相关使用。

多线程在许多语言当中都是至关重要的，许多场景下必定会使用到多线程。比如 web后端，比如爬虫，再比如游戏开发以及其他所有需要涉及开发ui界面的领域。因为凡是涉及到ui，必然会需要一个线程单独渲染页面，另外的线程负责准备数据和执行逻辑。因此，多线程是专业程序员绕不开的一个话题，也是一定要掌握的内容之一。

快速深入一门语言的几个问题（Python面试题

1hello, world

目标：屏幕上打印出hello, world。

原因：不解释。

进阶：当命令行给与不同参数的时候，打印hello, 名字。给与开关的时候，打印hello, 123。

2.正则提取

目标：写一个正则表达式(或者类似的东西)，从一段网页源码中找到某个标签的内容，去掉前后空格，显示。

原因：测试字符串处理能力。

进阶：支持正则扩展

3.扫描排重

目标：将某个目录和子目录下的所有文件扫描，排除重复的文件。

原因：测试文件系统操作能力。

进阶：多线程处理，注意吞吐颠簸

python面试题总结1-内存管理机制

（1）.引用计数

（2）. 垃圾回收

(3）. 内存池机制

在python中每创建一个对象，对应的会有一个引用计数，当发生赋值操作如a=b，对应的b的引用计数会自动加1，当引用的对象被清除或者函数结束时，引用计数会自动减1。

在python中使用引用计数，标记清楚，分代回收三种方式进行垃圾回收。

其中，引用计数当对象的引用计数归0时，对象会自动被清除。标记清除机制是首先遍历所有对象，如果对象可达，就说明有变量引用它，则标记其为可达的。如果不可达，则对其进行清除。分代回收是当对象创建时被标记为第0代，经过一次垃圾回收之后，余下的对象被标记为第1代，最高为第2代。其原理是，对象的生存期越长，月可能不是垃越。

ython语言虽然提供了对内存的垃圾收集机制，但实际上它将不用的内存放到内存池而不是返回给操作系统，所以就有了以下：

1 Pymalloc机制；这个主要是为了加速Python的执行效率，Python引入了一个内存池机制，用于管理，为了对小块内存的申请和释放。

2 Python中所有小于256个字节的对象都是依靠pymalloc分配器来实现的，而稍大的对象用的则是系统的malloc。

3 对于Python对象，比如整数、浮点数和List这些，都有自己独立的内存池，对象间并不共享他们的内存池。换句话说就是，假设你分配并且释放了大量的整数，那么用于缓存这些整数的内存就不能再分配给浮点数。

python 经典面试题有哪些

所说所有的变量都是对象。对象在python里，其实是一个指针，指向一个数据结构，数据结构里有属性，有方法。对象通常就是指变量。从面向对象OO的概念来讲，对象是类的一个实例。在python里很简单，对象就是变量。class A:myname="class a"上面就是一个类。不是对象a=A()这里变量a就是一个对象。它有一个属性（类属性），myname，你可以显示出来print a.myname所以，你看到一个变量后面跟点一个小数点。那么小数点后面