文章详情页
java - 爬虫爬取图片问题?
浏览:144日期:2023-10-31 08:12:21
问题描述
刚才修改了下 POM,大家可以重新下载源码这是我写的爬虫的项目地址 项目不报错,但是问题是下载图片到本地后经常性的是图片不完整,如下:
这是下载图片的核心代码,如下:
@Override public void run() {Response res = null;try { res = Jsoup.connect(src).ignoreContentType(true).timeout(30000).execute(); byte[] bytes = res.bodyAsBytes(); File file = new File(path + name); if (!file.exists()) {RandomAccessFile raf = new RandomAccessFile(file, 'rw');raf.write(bytes);raf.close(); }} catch (IOException e1) { e1.printStackTrace();} }
经过资料查询,感觉是范围请求 Range的问题或者自己没发现的问题?希望大家给看下,谢谢
问题解答
回答1:感觉是响应数据没获取完整,你debug一下看看响应的实际数据大小和你保存的数据大小是否有出入。
又或者因为还有一部分数据还在缓冲区中,没来得及写到文件,此时进程退出,导致数据不完整,关闭文件流之前执行一下flush操作。
标签:
java
相关文章:
1. node.js - node exec 执行没反应2. docker镜像push报错3. python 计算两个时间相差的分钟数,超过一天时计算不对4. docker-machine添加一个已有的docker主机问题5. 关于docker下的nginx压力测试6. mac里的docker如何命令行开启呢?7. dockerfile - 我用docker build的时候出现下边问题 麻烦帮我看一下8. angular.js - angularjs的自定义过滤器如何给文字加颜色?9. java - servlet的init方法和选择Filter的init方法来加载配置文件,二者有何区别?10. golang - 用IDE看docker源码时的小问题
排行榜

网公网安备