python爬虫实例,python例题代码

3359 blog.csdn.net/weixin _ 45912307/article/details/108529670

30个最小python代码(demo )1重复元素判定

以下方法检查指定列表中是否存在重复元素。所有重复元素都将使用set ()函数删除。

defall_unique(lst ) :返回len (lst )==len (set ) lst ) ) x=[ 1，1，2，2，3，2，3，3，4，5，6 ] y=

检查两个字符串的组成部分是否相同。

fromcollectionsimportcounterdefanagram (第一次，第二次) :返回计数器(第一次)==计数器(第二次) anagram ) ABCD

importsysvariable=30 print (sys.get sizeof (variable ) ) (# 24 2字符元素组成判定

下面的代码块检查字符串消耗的字节数。

defbyte_size(string ) :return(len ) string.encode (utf-8 ) ) ) ) ) byte_size ) ') byte_size ) )

这个代码块不需要循环语句就可以打印n次字符串。

n=2s='编程'打印(s * n )编程编程http://www.Sina.com /

下面的代码块使用title ()方法将字符串中每个单词的首字母大写。

s=' programmingisawesome ' print (s.title () ) programmingisawesome 3358 www.Sina.com /

指定特定大小，并定义按此大小剪切列表的函数。

frommathimportceildefchunk(lst，size ) :返回列表(map ) lambdax : lst [ x * size 3360 x * sizesize ]，list ] range ce

此方法允许删除布尔值，例如“False、None、0和”。要执行此操作，请使用filter ()函数。

defcompact(lst ) :返回列表(过滤器) bool，lst ) ) compact ) [ 0，1，False，2，'，3，' a '，' s '，34]

以下代码段允许将打包的对列表分解为两组不同的元组。

array=[['a '、' b']、['c '、' d']、['e '、' f ' ]传输=zip (阵列)打印) (传输) )

可以在一行代码中使用不同的运算符来比较多个不同的元素。

a=3print(2a8 ) trueprint )1==a2 ) # False 3内存占用

下面的代码将列表合并为一个字符串，并将每个元素之间的分隔符设置为逗号：

hobbies=['basketball '，' football '，' swimming ' ] print (' myhobbiesare : '，'.join ) (hobbbies ) ) myhobbbbies

以下方法使用正则表达式计算字符串中元音“a”、“e”、“I”、“o”和“u”的数量：

importredefcount_vowels(str ) :返回len (len ) re.findall ) r'[aeiou] )，str，re.IGNORECASE () ) ) )

以下方法显示指定字符串的第一个字符串

字符统一为小写。

def decapitalize(string):return str[:1].lower() + str[1:]decapitalize('FooBar') # 'fooBar'decapitalize('FooBar') # 'fooBar'

14 展开列表
该方法将通过递归的方式将列表的嵌套展开为单个列表。

def spread(arg):ret = []for i in arg:if isinstance(i, list):ret.extend(i)else:ret.append(i)return retdef deep_flatten(lst):result = []result.extend(spread(list(map(lambda x: deep_flatten(x) if type(x) == list else x, lst))))return resultdeep_flatten([1, [2], [[3], 4], 5]) # [1,2,3,4,5]

15 列表的差
该方法将返回第一个列表的元素，其不在第二个列表内。如果同时要反馈第二个列表独有的元素，还需要加一句 set_b.difference(set_a)。

def difference(a, b):set_a = set(a)set_b = set(b)comparison = set_a.difference(set_b)return list(comparison)difference([1,2,3], [1,2,4]) # [3]

16 通过函数取差
如下方法首先会应用一个给定的函数，然后再返回应用函数后结果有差别的列表元素。

from math import floordef difference_by(a, b, fn):b = set(map(fn, b))return [item for item in a if fn(item) not in b]difference_by([2.1, 1.2], [2.3, 3.4],floor) # [1.2]difference_by([{ 'x': 2 }, { 'x': 1 }], [{ 'x': 1 }], lambda v : v['x'])# [ { x: 2 } ]

17 链式函数调用
你可以在一行代码内调用多个函数。

def add(a, b):return a + bdef subtract(a, b):return a - ba, b = 4, 5print((subtract if a > b else add)(a, b)) # 9

18 检查重复项
如下代码将检查两个列表是不是有重复项。

def has_duplicates(lst):return len(lst) != len(set(lst))x = [1,2,3,4,5,5]y = [1,2,3,4,5]has_duplicates(x) # Truehas_duplicates(y) # False

19 合并两个字典
下面的方法将用于合并两个字典。

def merge_two_dicts(a, b):c = a.copy() # make a copy of ac.update(b) # modify keys and values of a with the once from breturn ca={'x':1,'y':2}b={'y':3,'z':4}print(merge_two_dicts(a,b))#{'y':3,'x':1,'z':4}

在 Python 3.5 或更高版本中，我们也可以用以下方式合并字典：

def merge_dictionaries(a, b)：return {**a, **b}a = { 'x': 1, 'y': 2}b = { 'y': 3, 'z': 4}print(merge_dictionaries(a, b))# {'y': 3, 'x': 1, 'z': 4}

20 将两个列表转化为字典
如下方法将会把两个列表转化为单个字典。

def to_dictionary(keys, values): return dict(zip(keys, values))keys = ["a", "b", "c"]values = [2, 3, 4]print(to_dictionary(keys, values))#{'a': 2, 'c': 4, 'b': 3}

21使用枚举
常用 For 循环来遍历某个列表，同样也能枚举列表的索引与值。

list = ["a", "b", "c", "d"]for index, element in enumerate(list): print("Value", element, "Index ", index, )# ('Value', 'a', 'Index ', 0)# ('Value', 'b', 'Index ', 1)#('Value', 'c', 'Index ', 2)# ('Value', 'd', 'Index ', 3)

22 执行时间
如下代码块可以用来计算执行特定代码所花费的时间。

import timestart_time = time.time()a = 1b = 2c = a + bprint(c) #3end_time = time.time()total_time = end_time - start_timeprint("Time: ", total_time)# ('Time: ', 1.1205673217773438e-05)

23 Try…else
在使用 try/except 语句的时也可以加一个 else 子句，如果没有触发错误的话，这个子句就会被运行。

try: 2*3except TypeError: print("An exception was raised")else: print("Thank God, no exceptions were raised.")#Thank God, no exceptions were raised.

24 元素频率
下面的方法会根据元素频率取列表中最常见的元素。

def most_frequent(list):return max(set(list), key = list.count)list = [1,2,1,2,3,2,1,4,2]most_frequent(list)

25回文序列
以下方法会检查给定的字符串是不是回文序列，它首先会把所有字母转化为小写，并移除非英文字母符号。最后，它会对比字符串与反向字符串是否相等，相等则表示为回文序列。

from re import subdef palindrome(string):s = sub('[W_]', '', string.lower())return s == s[::-1]palindrome('taco cat') # True

26不使用 if-else 的计算子
这一段代码可以不使用条件语句就实现加减乘除、求幂操作，它通过字典这一数据结构实现：

import operatoraction = {"+": operator.add,"-": operator.sub,"/": operator.truediv,"*": operator.mul,"**": pow}print(action['-'](50, 25)) # 25

27 Shuffle
该算法会打乱列表元素的顺序，它主要会通过 Fisher-Yates 算法对新列表进行排序：

from copy import deepcopyfrom random import randintdef shuffle(lst):temp_lst = deepcopy(lst)m = len(temp_lst)while (m):m -= 1i = randint(0, m)temp_lst[m], temp_lst[i] = temp_lst[i], temp_lst[m]return temp_lstfoo = [1,2,3]shuffle(foo) # [2,3,1] , foo = [1,2,3]

28 展开列表
将列表内的所有元素，包括子列表，都展开成一个列表。

def spread(arg):ret = []for i in arg:if isinstance(i, list):ret.extend(i)else:ret.append(i)return retspread([1,2,3,[4,5,6],[7],8,9]) # [1,2,3,4,5,6,7,8,9]

29 交换值
不需要额外的操作就能交换两个变量的值。

def swap(a, b):return b, aa, b = -1, 14swap(a, b) # (14, -1)spread([1,2,3,[4,5,6],[7],8,9]) # [1,2,3,4,5,6,7,8,9]

30字典默认值
通过 Key 取对应的 Value 值，可以通过以下方式设置默认值。如果 get() 方法没有设置默认值，那么如果遇到不存在的 Key，则会返回 None。

d = {'a': 1, 'b': 2}print(d.get('c', 3)) # 3