Функции XML парсера

XML (eXtensible Markup Language) это формат данных для обмена структурированными документами в Web. Это стандарт, созданный консорциумом World Wide Web consortium (W3C). Информация о XML и сопутствующих технологиях находится на сайте http://www.w3.org/XML/

Это расширение использует библиотеку expat, которую можно найти на http://www.jclark.com/xml/. Makefile, который поставляется вместе с expat, не строит библиотеку по умолчанию.

Пакет RPM-исходников expat можно найти на http://sourceforge.net/projects/expat/

Заметьте, что при использовании Apache-1.3.7 или новее у вас уже имеется соответствующая библиотека expat. Просто сконфигурируйте PHP с использованием --with-xml (без дополнительного пути), и он будет автоматически использовать библиотеку expat, встроенную в Apache.

В UNIX - запустите configure с опцией --with-xml. Библиотека expat должна быть установлена в таком месте, где компилятор сможет её найти. Если вы компилируете PHP как модуль для Apache 1.3.9 или новее, PHP будет автоматически использовать связанную библиотеку expat из Apache. Вам может понадобиться установка флагов CPPFLAGS и LDFLAGS в вашем окружении до запуска configure, если вы установили expat как-то экзотично.

Версия PHP для Windows имеет встроенную поддержку данного расширения. Это означает, что для использования данных функций не требуется загрузка никаких дополнительных расширений.
Об этом расширении

Это расширение PHP реализует поддержку expat James'а Clark'а в PHP. Этот набор утилит позволяет разбирать, но не проверять, XML-документы. Он поддерживает три исходные кодировки символов, также предоставляемые PHP: US-ASCII, ISO-8859-1 и UTF-8. UTF-16 не поддерживается.

Это расширение позволяет создавать XML-разборщики и определять обработчики различных XML-событий. Каждый XML-разборщик также имеет несколько параметров, которые вы можете настроить.

Функции обработчиков элементов могут получать имена своих элементов case-folded. Case-folding определяется стандартом XML как "процесс, применяемый к последовательности символов, когда те из них, которые идентифицируются как non-uppercase/не в верхнем регистре, заменяются своими эквивалентами верхнего регистра". Иначе говоря, если речь идёт о XML, case-folding означает перевод в верхний регистр.

По умолчанию все имена элементов, передаваемые функциям обработчиков, передаются с выравниванием регистра. Это поведение может запрашиваться и контролироваться XML-разборщиком с помощью функций xml_parser_get_option() и xml_parser_set_option(), соответственно.

XML-расширение РНР поддерживает набор символов Unicode через различные кодировки символов. Есть два типа кодировок символов, кодировка источника и кодировка цели. Внутреннее представление документа в PHP всегда кодируется в UTF-8.

Кодировка источника делается, когда XML-документ разбирается. После создания XML-разборщика кодировка источника может быть специфицирована (эта кодировка не может быть изменена позднее, в период существования XML-разборщика). Поддерживаются кодировки источника ISO-8859-1, US-ASCII и UTF-8. Первые две это однобайтные кодировки, то есть каждый символ представлен одним байтом. UTF-8 может кодировать символы, составленные из переменного количества бит (до 21) в 1-4 байтах. По умолчанию кодировка источника в РНР - ISO-8859-1.

Целевая кодировка выполняется, когда PHP передаёт данные функциям XML-обработчиков. Когда XML-обработчик создаётся, устанавливается та же самая целевая кодировка, что и исходная кодировка, но она может быть изменена в любой момент. Целевая кодировка влияет на символьные данные и на имена тэгов и цели инструкций процессинга.

Если XML-разборщик находит символы вне диапазона представления исходной кодировки, он возвратит ошибку.

Если PHP находит в разбираемом XML-документе символы, которые не могут быть представлены в избранной целевой кодировке, проблемные символы будут "понижены в звании". В настоящее время это означает, что такие символы заменяются знаком вопроса.

Интересное о спорте вы найдете по адресу http://www.fifa2009s.ru/publ

Функция PHP utf8_decode

Раздел: Функции XML парсера

конвертирует строку с символами набора ISO-8859-1, кодированными в UTF-8, в однобайтные символы ISO-8859-1

Читать далее...

Функция PHP utf8_encode

Раздел: Функции XML парсера

кодирует строку ISO-8859-1 в UTF-8

Читать далее...

Функция PHP xml_error_string

Раздел: Функции XML парсера

получает строку ошибки XML-разборщика

Читать далее...

Функция PHP xml_get_current_byte_index

Раздел: Функции XML парсера

получает индекс текущего байта для для XML-разборщика

Читать далее...

Функция PHP xml_get_current_column_number

Раздел: Функции XML парсера

получает номер текущего столбца для XML-разборщика

Читать далее...

Функция PHP xml_get_current_line_number

Раздел: Функции XML парсера

получает номер текущей строки для XML-разборщика

Читать далее...

Функция PHP xml_get_error_code

Раздел: Функции XML парсера

получает код ошибки XML-разборщика

Читать далее...

Функция PHP xml_parse

Раздел: Функции XML парсера

стартует разбор XML-документа

Читать далее...

Функция PHP xml_parser_free

Раздел: Функции XML парсера

освобождает XML-разборщик

Читать далее...

Функция PHP xml_parser_get_option

Раздел: Функции XML парсера

получает опции из XML-разборщика

Читать далее...

Функция PHP xml_parser_set_option

Раздел: Функции XML парсера

устанавливает опции в XML-разборщике

Читать далее...

Функция PHP xml_parse_into_struct

Раздел: Функции XML парсера

разбирает XML-данные в структуру массива

Читать далее...

Функция PHP xml_set_character_data_handler

Раздел: Функции XML парсера

настраивает обработчик символьных данных

Читать далее...

Функция PHP xml_set_default_handler

Раздел: Функции XML парсера

настраивает обработчик по умолчанию

Читать далее...

Функция PHP xml_set_element_handler

Раздел: Функции XML парсера

настраивает обработчики стартовых и конечных элементов

Читать далее...

Функция PHP xml_set_end_namespace_decl_handler

Раздел: Функции XML парсера

настраивает обработчик символьных данных

Читать далее...

Функция PHP xml_set_external_entity_ref_handler

Раздел: Функции XML парсера

настраивает обработчик ссылки на внешний экземпляр

Читать далее...

Функция PHP xml_set_notation_decl_handler

Раздел: Функции XML парсера

настраивает обработчик объявления нотации

Читать далее...

Функция PHP xml_set_object

Раздел: Функции XML парсера

использует XML-разборщик внутри объекта

Читать далее...

Функция PHP xml_set_processing_instruction_handler

Раздел: Функции XML парсера

настраивает обработчик инструкций процессинга/processing instruction (PI)

Читать далее...

Функция PHP xml_set_start_namespace_decl_handler

Раздел: Функции XML парсера

настраивает обработчик символльных данных

Читать далее...

Функция PHP xml_set_unparsed_entity_decl_handler

Раздел: Функции XML парсера

настраивает обработчик объявления неразбираемого экземпляра

Читать далее...