Ayrıştırma, web sayfası programlamada yaygın olarak kullanılan tekniklerden biridir. Gerekli komut dosyasını kendiniz yazmanın bir yolu olmadığında, az sayıda komut kullanarak siteye gerekli hizmeti kolayca ve basit bir şekilde almanızı sağlar.
Talimatlar
Aşama 1
Ayrıştırmanın en kolay yolu PHP işlevi file_get_contents () kullanmaktır. Bir dosyanın içeriğini metin dizesi olarak almanızı sağlar. İşlev, performansını artıran "bellek eşleme" algoritmasını kullanır.
Adım 2
Örneğin, Rusya Federasyonu Merkez Bankası'nın bir web sitesindeki verileri ayrıştıran bir komut dosyası yazmak için, daha önce siteye uygun biçimde tarihi tanımlamış olan uygun işlevi kullanarak bir XML sayfasının içeriğini almanız gerekir, ve sonra bölmek için normal ifadeler kullanmak. Seçilen para birimini görüntülemek için Banka'nın web sitesinden alınan kod kullanılır: $ data = tarih (“g / m / Y”); $ get = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp) ?date_req=$ data); preg_match (“/(.*?)/ is”, $ get, $ string); preg_match (“/(.*?)/ is”, $ string [1], $ str);
Aşama 3
XML dosyasının kendisini ayrıştırmak istiyorsanız, buna karşılık gelen işlevler de vardır. Ayrıştırıcıyı başlatmak için, onu xml_parser_create kullanarak başlatmanız gerekir: $ parser = xml_parser_create ();
4. Adım
Ardından, ilgili etiketleri ve metin bilgilerini işleyecek bir işlev listesi belirlenir. İlgili XML öğesi başlangıç ve bitiş işleyicileri ayarlanır: xml_set_element_handler ($ ayrıştırıcı, "startElement", "endElement");
Adım 5
Veriler, uygun döngü içinde standart fopen() ve fgets() işlevleri kullanılarak okunabilir. Dosyaların içeriği xml_parse() içinde satır satır döndürülür. Son parametre, son satırı okuma bayrağını içerir: while ($ content = fgets ($ fparse)) {
if (! xml_parse ($ ayrıştırıcı, $ içerik, feof ($ fparse))) {
yankı "Hata";
kırmak; }}
6. Adım
xml_parser_free() işlevi, sistem tarafından işgal edilen kaynakları boşaltmak için kullanılır. Bu işlevler en çok XML dosyalarını işlerken güçlüdür.