Ayrıştırıcı Nasıl Yapılır

İçindekiler:

Ayrıştırıcı Nasıl Yapılır
Ayrıştırıcı Nasıl Yapılır
Anonim

Ayrıştırma, web sayfası programlamada yaygın olarak kullanılan tekniklerden biridir. Gerekli komut dosyasını kendiniz yazmanın bir yolu olmadığında, az sayıda komut kullanarak siteye gerekli hizmeti kolayca ve basit bir şekilde almanızı sağlar.

ayrıştırıcı nasıl yapılır
ayrıştırıcı nasıl yapılır

Talimatlar

Aşama 1

Ayrıştırmanın en kolay yolu PHP işlevi file_get_contents () kullanmaktır. Bir dosyanın içeriğini metin dizesi olarak almanızı sağlar. İşlev, performansını artıran "bellek eşleme" algoritmasını kullanır.

Adım 2

Örneğin, Rusya Federasyonu Merkez Bankası'nın bir web sitesindeki verileri ayrıştıran bir komut dosyası yazmak için, daha önce siteye uygun biçimde tarihi tanımlamış olan uygun işlevi kullanarak bir XML sayfasının içeriğini almanız gerekir, ve sonra bölmek için normal ifadeler kullanmak. Seçilen para birimini görüntülemek için Banka'nın web sitesinden alınan kod kullanılır: $ data = tarih (“g / m / Y”); $ get = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp) ?date_req=$ data); preg_match (“/(.*?)/ is”, $ get, $ string); preg_match (“/(.*?)/ is”, $ string [1], $ str);

Aşama 3

XML dosyasının kendisini ayrıştırmak istiyorsanız, buna karşılık gelen işlevler de vardır. Ayrıştırıcıyı başlatmak için, onu xml_parser_create kullanarak başlatmanız gerekir: $ parser = xml_parser_create ();

4. Adım

Ardından, ilgili etiketleri ve metin bilgilerini işleyecek bir işlev listesi belirlenir. İlgili XML öğesi başlangıç ve bitiş işleyicileri ayarlanır: xml_set_element_handler ($ ayrıştırıcı, "startElement", "endElement");

Adım 5

Veriler, uygun döngü içinde standart fopen() ve fgets() işlevleri kullanılarak okunabilir. Dosyaların içeriği xml_parse() içinde satır satır döndürülür. Son parametre, son satırı okuma bayrağını içerir: while ($ content = fgets ($ fparse)) {

if (! xml_parse ($ ayrıştırıcı, $ içerik, feof ($ fparse))) {

yankı "Hata";

kırmak; }}

6. Adım

xml_parser_free() işlevi, sistem tarafından işgal edilen kaynakları boşaltmak için kullanılır. Bu işlevler en çok XML dosyalarını işlerken güçlüdür.

Önerilen: