UNIX中的文件切割
UNIX的SHELL功能强大,非Windows可比,从上面使用的TAR、FTP已可管窥。同样,UNIX已经提供了文件切割功能,不需要费力气去寻找第三方的文件切割程序。能完成这个功能的UNIX命令就是DD。
要切割的大文件为DGJD,共98336321字节,则:
dd if=dgjd of=zz1 bs=1 count=20000000 dd if=dgjd of=zz2 bs=1 count=20000000 skip=20000000 dd if=dgjd of=zz3 bs=1 count=20000000 skip=40000000 dd if=dgjd of=zz4 bs=1 count=20000000 skip=60000000 dd if=dgjd of=zz5 bs=1 count=18336321 skip=80000000
其中IF(INPUT FILENAME)是要切割的大文件名,OF(OUTPUT FILENAME)是切割后的子文件名,BS是指明以多少字节作为一个切割记录单位,COUNT是要切割的单位记录数,SKIP是说明切割时的起点,单位同样以BS设定值为准。通过上述五条指令就将DGJD大文件切割成为4个2千万字节、1个18336321字节的子文件。要注意的是SKIP的值不能错。 由此也不难看出,DD切割是“非损耗”式的切割,并且支持从任意位置开始的任意大小的切割。
要将生成的ZZ1、ZZ2、ZZ3、ZZ4四个子文件组装为XDGJD,则:
dd if=zz1 of=xdgjd bs=1 count=20000000 dd if=zz2 of=xdgjd bs=1 count=20000000 seek=20000000 dd if=zz3 of=xdgjd bs=1 count=20000000 seek=40000000 dd if=zz4 of=xdgjd bs=1 count=20000000 seek=60000000 dd if=zz5 of=xdgjd bs=1 count=18336321 seek=80000000
其中SKIP参数改为SEEK参数,指明组装的新大文件XDGJD每次的开始位置是从文件头开始多少字节。如果缺省,则组装从文件头开始,显然这不是我们每次都希望的, 所以需用SEEK参数明确指出开始位置。通过以上5个指令,即可将5个子文件重新组装为一个大文件。
将切割后生成的子文件重新用FTP传送,结果有的能够顺利传送, 有的仍然导致网络瘫痪,不怕,继续切割,切成每个一千万字节,再传,OK!成功传送!
测试表明,每次传送的文件最好小于12M字节,否则可能导致网络故障。另外,DD这个命令最初是为了进行编码转换而设计的,用于在大型机中将EBCDIC字符代码转换为ASCII代码,但此功能已不常用,现在DD成了文件系统备份的工具,以及做一些类似文件切割的“另类业务”,正所谓“有心栽花花不开,无心插柳柳成荫”,不过对于用户来说,重要的是软件能否完成自己需要的功能,它的“本职工作”是什么并不重要,“不管白猫黑猫,捉住老鼠就是好猫”!实用为本,软件的生命力就在于实用。