В процессе проектной работы мы часто устанавливаем различные спецификации, чтобы способствовать лучшему сотрудничеству между командами и лучшими проектами; Мы часто слышим различные протоколы, такие как открытый протокол XMPP, используемый Google Software Gtalk. Пока другое программное обеспечение IM также соответствует протоколу XMPP, его можно использовать и общаться с GTALK; В Интернете нет подсчета информации, и сама эта информация существует независимо. Как подключить его последовательно и представить его пользователям, требуется использование протокола HTTP.
Точно так же, поскольку браузеры имеют разные ядра и разные визуализации стилей по умолчанию, им нужно правило, которому следует каждый браузер, чтобы гарантировать, что стили, представленные одним и тем же веб -документом в разных браузерах, являются последовательными. Это правило является декларацией Doctype.
Поскольку Интернет совместимый, любые два или более веб -документов могут включать обмен данными. Поскольку язык XML позволяет пользователям настраивать теги, любые два обменных документа могут иметь одинаковые теги, что приводит к конфликтам тех же тегов. Следовательно, пространство имен необходимо, чтобы отличить те же теги, которые могут существовать в обменном документе.
В качестве языка для перехода HTML на XML, XHTML не может реализовать определенные пользовательские теги на языке XML, поэтому пространства имен в документах XHMTL одинаковы:
<html xmlns = http: //www.w3.org/1999/xhtml>
XMLNS является аббревиатурой пространства имен XHTML, которое является так называемым пространством имен. Как и декларация Doctype, XMLNS также является декларацией. В отличие от декларации Doctype, все еще существует в документе HTML, XMLNS не существует в документе HTML, и XMLN, которые мы обычно видим в документе XHTML.
При создании веб -страницы, в дополнение к объявлению Doctype (тип документа) в начале, если это документ XHTML, он также должен объявить пространство имен, и третья вещь, которую нужно объявить, - это тип кодирования символов в документе веб -страницы:
<meta http-equiv = content-type content = text/html; charset = utf-8 ' />
Чтобы правильно интерпретировать браузер и проверять W3C, каждый документ XHTML должен объявить об использованном кодировании символов. Много раз большинство искаженных кодов в веб -документах вызваны неправильным кодированием персонажа.
UTF-8 является экспрессией кодирования переменной длины Unicode. Как глобально универсальный кодирование персонажа, он используется во все большем количестве веб -документов. Веб-страницы с использованием кодирования символов UTF-8 могут максимизировать избегание искаженного кода, вызванного различными кодировками символов, когда пользователи в разных регионах получают доступ к одной и той же веб-странице.
Но когда мы открываем большинство внутренних сайтов, особенно крупных портальных сайтов, заявление о кодировании персонажа не является UTF-8, а GB2312:
<meta http-equiv = content-type content = text/html; charset = gb2312 ' />
Конечно, в дополнение к GB2312, есть некоторые веб -сайты, которые используют кодирование GBK или GB18030. Эти три кодировки символов принадлежат упрощенному набору китайских символов. То есть, если на компьютере не установлен упрощенный китайский набор символов, когда он обращается к китайской веб -странице с символом, кодируемым как GB2312, отображается искаженный код.
Поскольку искаженная код может возникнуть из-за доступа пользователя в разных регионах при использовании кодирования символов GB2312, почему бы не использовать UTF-8?
Одной из причин может быть исторические причины, в то время как другой более важной причиной должна быть различные размеры документов из -за различных методов хранения двух кодировки.
При использовании набора кодирования символов GB2312 китайский символ занимает 2 байта, в то время как количество байтов, занятых китайским символом в кодировании UTF-8, часто составляет 3 байта или даже более 3 байтов. Следовательно, для того же китайского документа объем хранения с использованием кодирования символов GB2312 меньше, чем размер документа, хранящийся в кодировании UTF-8.
Для китайских веб-сайтов с большим количеством текста и большого количества посещений, используя документы веб-страницы, кодируемые GB2312, могут сохранить большой трафик при загрузке и передаче. Кроме того, потому что группа пользователей китайских веб-сайтов в основном заблокирована для китайских пользователей, поэтому многие веб-сайты используют GB2312-кодированные вместо UTF-8.
Тем не менее, в Китае не так много веб -сайтов с большим количеством текста и посещений. Кроме того, проблема искаженного кода может быть в паре, поэтому рекомендуется использовать кодирование UTF-8 при создании веб-страниц.
Конечно, независимо от того, какой тип кодировки используется, наиболее важным является то, что кодирование, используемое на сайте, должна быть объединена.
Для объявлений кодирования символов в дополнение к вышеуказанному методу вы также можете увидеть другой метод объявления:
<meta http-equiv = content-language content = gb2312 ' />
<meta http-equiv = content-language content = zh-cn />>>
Этот метод объявления предназначен для старых версий браузеров. Этот метод объявления не рекомендуется сегодня, когда браузеры обычно обновляются.