2005-08-16 09:37:01 utf-8文件的no bom和bom格式
#1
在其他的討論中看

http://www.1zsoft.com/Forum/viewtopic.php?id=196

到utf-8文件有no bom和bom格式2種,

有誰可以說明一下這兩個要怎麼存呢?



因為NotePad、記事本中都只能存utf-8,但不能決定要用那種格式。

是用其他的軟件才有這種功能嗎?
sune 最后编辑, 2005-09-15 17:48:20 回复
2005-08-20 10:59:45
#2
ultraedit最新版本中有这个功能。
回复
2005-09-15 17:48:20
#3
以下內容是從Google搜尋而來:

按標準UTF-8檔案加不加BOM都可以(詳細資料可瀏覽www.unicode.org),因為程式一般都可以依文章內容推算是否UTF-8,不過以UltraEdit為例,有時UTF-8短句是會被錯認為ANSI編碼。加BOM是較保險的做法,而且MS的記事本、IE及Word等當文件儲成UTF-8格式時都是加入BOM的,讓程式開啟時能輕易辨明正確編碼。

UTF-8的BOM是 EFBBBF,因為UltraEdit匯入UTF-8文件後內容會轉做Unicode-LE(所以在Hex模式看到的並非UTF-8文件原本的字碼),上述的EFBBBF當轉成Unicode-LE後便是FFFE(Unicode-LE的BOM),UltraEdit不能辨認這個BOM有理無理自己又加多一個BOM,所以有兩個FFFE出現。

因此,最好的方法就是在UltraEdit內將
Write UTF-8 BOM header to ALL UTF-8 files when saved
設成OFF,就不會在儲存時又在檔案中加入了BOM
回复
时间: 16.2 毫秒, 内存: 831.7 KB, 查询: 8.