domain = 'https://img2.huashi6.com' # 图片地址获取函数 def analysis(item,results): pattern = re.compile(item, re.I|re.M) result_list = pattern.findall(results) return result_list # 图片格式转换函数 def change_webp2png(name_webp, name_png, img_url): try: image_wepb = Image.open...
response = requests.get(url=url, headers=headers, params=params) # 2. 获取数据 json_data = response.json() # 3. 解析数据 # 结构化数据 json数据 字典键值对取值 re # 非结构化数据 html网页 网页源代码css xpath re top_list = json_data['data']['top_list_item_info'] for top in top_l...
response=requests.get(url=url,headers=headers,params=params)#2.获取数据 json_data=response.json()#3.解析数据 # 结构化数据 json数据 字典键值对取值 re # 非结构化数据 html网页 网页源代码 css xpath re top_list=json_data['data']['top_list_item_info']fortopintop_list:uname=top['item_detail...
p={}" domain = 'https://img2.huashi6.com' # 图片地址获取函数def analysis(item,results): pattern = re.compile(item, re.I|re.M) result_list = pattern.findall(results) return result_list#图片格式转换函数def change_webp2png(name_webp, name_png, img_url): try: image_wepb = Image.o...
list1[2:5]list1[-5:-1]切片用冒号分隔。冒号前表示起始位置(如果不写表示第一个位置0)冒号后表示结束位置(如果不写表示最后一个位置)还可以写成负数,也就是从后向前数,-1表示最后一个位置。建议自己创建一个列表实例,实践一下会理解更深。通过循环迭代 for x in list1:print(x)不过通常我们更习惯...
【语法基础篇】for循环、break和continue 30:57 【语法基础篇】字符串编码、索引与切片 43:52 【语法基础篇】字符串的常用操作详解 38:52 【语法基础篇】列表的定义与列表的修改、增加、删除 46:49 【语法基础篇】列表的查找,排序与列表推导式 31:41 【语法基础篇】元组与元组的常见操 31:57 【语法基础篇】...
不可哈希:可变的数据类型(list dict set) 1. 2. 列表的增删改查 # 向列表中添加内容 lst = [] lst.append("动漫") # 追加内容 lst.append("二次元") lst.insert(0, "我") # 指定位置插入 lst.extend(['海贼王', '春物', 'EVA']) # 合并列表,批量添加 ...
top_list=json_data['data']['top_list_item_info']fortop in top_list:uname=top['item_detail']['uname']print(f'正在爬取: {uname}')ifnot os.path.exists(f'img/{uname}'):os.mkdir(f'img/{uname}')image_list=top['item_detail']['image_list']forimg in image_list:path=img['path'...
url_list=[f'https://www.bilibili.com/ranking/all/{i}/0/30'foriinlabels_num]#利用pprint方法,我们能够在输出时实现一个url一行pprint(url_list) 4.2 详细信息页面api解析 我们还需要获取视频的播放量、三连量、评论量、弹幕量、转发量、热门标签,但在排行榜页中并没...
each(url_list[j],path_z,Num) j = j -1Update(path_z,i)#写入更新defmain():base_url =str(input('请输入漫画首页地址: \n')) path_a ='c:\\'#存储根目录,自行更改url_l =list(base_url) s =''num =0forainurl_l:#获取漫画编号ifnum ==3: ...