文章详情页
用Java实现断点续传(HTTP
内容: 出自:钟华 用Java实现断点续传(HTTP) 内容: (一)断点续传的原理 (二)Java实现断点续传的关键几点 (三)断点续传内核的实现 关于作者 钟华 (zhong_hua@263.net)2001 年 5 月(一)断点续传的原理 其实断点续传的原理很简单,就是在Http的请求上和一般的下载有所不同而已。打个比方,浏览器请求服务器上的一个文时,所发出的请求如下:假设服务器域名为wwww.sjtu.edu.cn,文件名为down.zip。GET /down.zip HTTP/1.1Accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms-excel, application/msword, application/vnd.ms-powerpoint, */*Accept-Language: zh-cnAccept-Encoding: gzip, deflateUser-Agent: Mozilla/4.0 (compatible; MSIE 5.01; Windows NT 5.0)Connection: Keep-Alive服务器收到请求后,按要求寻找请求的文件,提取文件的信息,然后返回给浏览器,返回信息如下:200Content-Length=106786028Accept-Ranges=bytesDate=Mon, 30 Apr 2001 12:56:11 GMTETag=W/'02ca57e173c11:95b'Content-Type=application/octet-streamServer=Microsoft-IIS/5.0Last-Modified=Mon, 30 Apr 2001 12:56:11 GMT所谓断点续传,也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给Web服务器的时候要多加一条信息--从哪里开始。下面是用自己编的一个'浏览器'来传递请求信息给Web服务器,要求从2000070字节开始。GET /down.zip HTTP/1.0User-Agent: NetFoxRANGE: bytes=2000070-Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2仔细看一下就会发现多了一行RANGE: bytes=2000070-这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传,前面的字节不用传了。服务器收到这个请求以后,返回的信息如下:206Content-Length=106786028Content-Range=bytes 2000070-106786027/106786028Date=Mon, 30 Apr 2001 12:55:20 GMTETag=W/'02ca57e173c11:95b'Content-Type=application/octet-streamServer=Microsoft-IIS/5.0Last-Modified=Mon, 30 Apr 2001 12:55:20 GMT和前面服务器返回的信息比较一下,就会发现增加了一行:Content-Range=bytes 2000070-106786027/106786028返回的代码也改为206了,而不再是200了。知道了以上原理,就可以进行断点续传的编程了。(二)Java实现断点续传的关键几点 (1)用什么方法实现提交RANGE: bytes=2000070-。当然用最原始的Socket是肯定能完成的,不过那样太费事了,其实Java的net包中提供了这种功能。代码如下:URL url = new URL('http://www.sjtu.edu.cn/down.zip');HttpURLConnection httpConnection = (HttpURLConnection)url.openConnection();//设置User-AgenthttpConnection.setRequestProperty('User-Agent','NetFox');//设置断点续传的开始位置httpConnection.setRequestProperty('RANGE','bytes=2000070');//获得输入流InputStream input = httpConnection.getInputStream();从输入流中取出的字节流就是down.zip文件从2000070开始的字节流。大家看,其实断点续传用Java实现起来还是很简单的吧。接下来要做的事就是怎么保存获得的流到文件中去了。保存文件采用的方法。我采用的是IO包中的RandAccessFile类。操作相当简单,假设从2000070处开始保存文件,代码如下:RandomAccess oSavedFile = new RandomAccessFile('down.zip','rw');long nPos = 2000070;//定位文件指针到nPos位置oSavedFile.seek(nPos);byte[] b = new byte[1024];int nRead;//从输入流中读入字节流,然后写到文件中while((nRead=input.read(b,0,1024))> 0){oSavedFile.write(b,0,nRead);}怎么样,也很简单吧。接下来要做的就是整合成一个完整的程序了。包括一系列的线程控制等等。(三)断点续传内核的实现主要用了6个类,包括一个测试类。SiteFileFetch.java负责整个文件的抓取,控制内部线程(FileSplitterFetch类)。FileSplitterFetch.java负责部分文件的抓取。FileAccess.java负责文件的存储。SiteInfoBean.java要抓取的文件的信息,如文件保存的目录,名字,抓取文件的URL等。Utility.java工具类,放一些简单的方法。TestMethod.java测试类。下面是源程序: /***SiteFileFetch.java*/package NetFox;import java.io.*;import java.net.*;public class SiteFileFetch extends Thread {SiteInfoBean siteInfoBean = null; //文件信息Beanlong[] nStartPos; //开始位置long[] nEndPos; //结束位置FileSplitterFetch[] fileSplitterFetch; //子线程对象long nFileLength; //文件长度boolean bFirst = true; //是否第一次取文件boolean bStop = false; //停止标志File tmpFile; //文件下载的临时信息DataOutputStream output; //输出到文件的输出流public SiteFileFetch(SiteInfoBean bean) throws IOException{siteInfoBean = bean;//tmpFile = File.createTempFile ('zhong','1111',new File(bean.getSFilePath()));tmpFile = new File(bean.getSFilePath()+File.separator + bean.getSFileName()+'.info');if(tmpFile.exists ()){bFirst = false;read_nPos();}else{nStartPos = new long[bean.getNSplitter()];nEndPos = new long[bean.getNSplitter()];}}public void run(){//获得文件长度//分割文件//实例FileSplitterFetch//启动FileSplitterFetch线程//等待子线程返回try{if(bFirst){nFileLength = getFileSize();if(nFileLength == -1){System.err.println('File Length is not known!');}else if(nFileLength == -2){System.err.println('File is not access!');}else{for(int i=0;i
标签:
Java
相关文章:
排行榜