文章详情页
java - 爬虫爬取图片问题?
问题描述
刚才修改了下 POM,大家可以重新下载源码这是我写的爬虫的项目地址 项目不报错,但是问题是下载图片到本地后经常性的是图片不完整,如下:
这是下载图片的核心代码,如下:
@Override public void run() {Response res = null;try { res = Jsoup.connect(src).ignoreContentType(true).timeout(30000).execute(); byte[] bytes = res.bodyAsBytes(); File file = new File(path + name); if (!file.exists()) {RandomAccessFile raf = new RandomAccessFile(file, 'rw');raf.write(bytes);raf.close(); }} catch (IOException e1) { e1.printStackTrace();} }
经过资料查询,感觉是范围请求 Range的问题或者自己没发现的问题?希望大家给看下,谢谢
问题解答
回答1:感觉是响应数据没获取完整,你debug一下看看响应的实际数据大小和你保存的数据大小是否有出入。
又或者因为还有一部分数据还在缓冲区中,没来得及写到文件,此时进程退出,导致数据不完整,关闭文件流之前执行一下flush操作。
标签:
java
相关文章:
1. dockerfile - [docker build image失败- npm install]2. docker images显示的镜像过多,狗眼被亮瞎了,怎么办?3. debian - docker依赖的aufs-tools源码哪里可以找到啊?4. docker绑定了nginx端口 外部访问不到5. boot2docker无法启动6. docker start -a dockername 老是卡住,什么情况?7. 如何判断数组写入数据库有重复的值8. macos - mac下docker如何设置代理9. angular.js使用$resource服务把数据存入mongodb的问题。10. docker-compose 为何找不到配置文件?
排行榜