UNIX、DOS文件格式的区别

创建时间:2016/6/20 9:40
来源:http://blog.csdn.net/fall221/article/details/6937031

 

UNIX、DOS文件格式的区别

标签: dosunixwindowsapple测试脚本
2011-11-04 20:07 4498人阅读 评论(0) 收藏 举报

版权声明:本文为博主原创文章,未经博主允许不得转载。

       【背景】老师布置写个静止图像压缩的程序。用DCT变换和游程编码写了个简易的版本,编码和解码端就是对不上,报出莫名其妙的错误。debug良久,最后,将压缩结果用fwrite写入文件之后,直接用fread原样读取,结果照样出错!问题找到了,但是不知道原因。查了很久,终于发现可能是文件格式的问题,今天终于发现了。

      fwrite写文件测试。先指定参数为wb,表示二进制格式,写入0x00-0xff共256个数,包括了ASCII码表中的所有值。    代码如下:

[cpp] view plain copy
  1. int main()  
  2. {  
  3.     char aa[256];  
  4.     int i;  
  5.     for (i=0; i<256; i++)  
  6.     {  
  7.         aa[i] = i;  
  8.     }  
  9.     FILE *wr;  
  10.     wr=fopen("asd.txt","wb");  
  11.     if (wr==NULL)  
  12.     {  
  13.         printf("wrong!\n");  
  14.         return(1);  
  15.     }  
  16.   
  17.     fwrite(aa,1,256,wr);  
  18.     fclose(wr);  
  19.          return 0;  
  20. }  

      得到的结果没有问题。文件属性显示大小确实为256字节。用UltraEdit来看,提示是否转为DOS格式,选择否,然后看到的结果也是正确的。

                                         

                                                                图1                                                                                                                           图2

      不过,用UltraEdit打开的时候,提示是否转为DOS格式,如果选择是,就不是图2的结果了,而是图3:

                                              

                                                                                                                                          图3
       文件属性也显示,文件大小为257个字节。仔细检查,发现在0x09和0x0A之间多了一个0x0D。而其他地方则是一样的。在上面的测试代码中,将二进制模式"wb"改为文本模式"wt",或者不指定模式(默认为文本模式),则得到的结果也是图3的形式。

[cpp] view plain copy
  1. wr=fopen("asd.txt","wt");  

      因此,可以总结如下:

       1.  fwrite函数,加上b表示二进制模式;不加或者加上t表示文本模式。

       2.  fwrite用二进制模式写文件时,原样写入;文本模式写文件时,遇到换行符(0x0A,10,\n,LF,line feed),会在前面插入一个回车符(0x0D,13,\r,CR,carriage return)。

      3. 另外,最好fread与fwrite相对应,统一采用文本模式或二进制模式。fread遇到\r\n,即0D0A时,会解释为0A。

      这只是在windows系统下如此。关于文件格式,有一段资料非常经典

http://linux.chinaunix.net/techdoc/system/2009/07/17/1124903.shtml

以及

http://shx-yi123.iteye.com/blog/750717

用UltraEdit打开文件时有时会提示“提示希望转换xxx 到DOS格式吗?”原因如下:
    很久以前,人们用老式的电传打字机作为输入设备,它使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车,DE><CR>DE>),另一个字符把纸上移一行(称为换行,DE><LF>DE>)。
    当计算机问世后,由于存储器曾经非常昂贵。有些人就认定没必要用两个字符来表示行尾。 
    于是UNIX 开发者决定他们可以用 DE><Line Feed>DE> 一个字符来表示行尾。   
    Apple开发者规定了用 DE><CR>DE>。 
    开发 MS-DOS (以及微软视窗) 的那些家伙则决定沿用老式的 DE><CR>DE>DE><LF>DE>。 
    三种行尾格式如下: 
        unix            DE><LF>DE> 
        dos             DE><CR>DE>DE><LF>DE> 
        mac             DE><CR>DE> 
   这意味着,如果你试图把一个文件从一种系统移到另一种系统,那么你就有换行符方面的麻烦。 
取消该提示的措施: 

如果你的程序将来需要在UNIX/linux,最好是保持 unix的格式。 

点选 高级 菜单—>文件处理 —> 选择 DOS/UNIX/MAC 处理 ,在右侧的unix/mac 文件检测/转换下面,勾上 禁用。确定,以后就不会提示了。

      总结如下:

      1. dos、windows下,行尾为 \r\n

      2. mac下,行尾为 \r

      3. UNIX/LInux下,行尾为 \n

      转换时,可以借助工具或脚本。如UltraEdit另存为时,可以选择换行模式。

                                                   


                                                                                                                             图 4