XML編碼
編碼 是Unicode字符轉換為等效的二進製表示的過程。當XML處理器讀取XML文檔,它編碼依賴於編碼的類型的文件。因此,我們需要指定XML聲明的編碼類型.
編碼類型
主要有兩種類型的編碼:
- UTF-8
- UTF-16
UTF代表UCS轉換格式,但UCS的意義是通用字符集。編號8或16中的指用來表示一個字符的比特數。它們或者是8(一個字節)或16(兩個字節)。對於冇有編碼信息的文件,UTF-8的默認設置.
句法
編碼類型被包括在XML文檔的序言部分。句法為UTF-8編碼方式如下圖所示:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 編碼的句法
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
例子
下麵的例子顯示的聲明編碼:
<?xml version="1.0" encoding="UTF-8" standalone="no" ?> <contact-info> <name>Tanmay Patil</name> <company>YiiBai</company> <phone>(011) 123-4567</phone> </contact-info>
在上麵的例子中的編碼=“UTF-8”,則指定的8位被用於表示字符。來表示的16位字符,UTF-16編碼可使用.
UTF-8編碼的XML文件比UTF-16格式的文件更小.