您的位置:首页技术文章
文章详情页

python - 关于爬取网站,下载图片的时候碰到网址结构问题卡住

【字号: 日期:2022-09-23 17:34:29浏览:69作者:猪猪

问题描述

下载图片的时候很容易碰到下载了几张之后碰到图片的链接里面含有/时会出现:FileNotFoundError: [Errno 2] No such file or directory:

例如:图一:http://gnondgnoqnioandiofnas_swn_ssy_mhtng.jpg图二:http://asnoqenconvoqenripetn_swn_ssy_mhtng.jpg图三:http://asdnioqnoqwrqwenoqwr/12345/123/1256.gif

for item in download_link: urllib.request.urlretrieve(item,folder_path + item[-19:]) time.sleep(2) print(’Done’)

运行到图三的时候就中断了,我的理解是因为图三的地址有/,造成文件夹之后再次进入子文件夹进不去,所以出错。

(1)想请问下怎么样能跳过这个文件,继续下载后面的图片(2)或者说有什么办法能直接把这个图三直接下载了

问题解答

回答1:

urlretrieve第二个参数是文件名,文件名里面是不允许有斜杠的,可以这样做:

urllib.request.urlretrieve(item,folder_path + item.split(’/’)[-1])回答2:

粗暴一点,你可以try一下。

标签: Python 编程