Kif Tkaxkar Sit Kbir U Tiġbed Id-Dejta Permezz ta 'Screaming Frog's SEO Spider

Screaming Frog SEO Spider

Aħna qed ngħinu lil bosta klijenti bħalissa bihom Migrazzjonijiet Marketo. Hekk kif kumpaniji kbar jużaw soluzzjonijiet ta 'intrapriża bħal din, huwa bħal spider web li jinseġ lilu nnifsu fi proċessi u pjattaformi matul is-snin ... sal-punt li l-kumpaniji lanqas biss huma konxji ta' kull punt ta 'kuntatt.

Bi pjattaforma ta 'awtomazzjoni ta' kummerċjalizzazzjoni ta 'intrapriża bħal Marketo, il-formoli huma l-punt tad-dħul tad-dejta fis-siti u l-paġni tal-inżul. Il-kumpaniji spiss ikollhom eluf ta ’paġni u mijiet ta’ formoli fis-siti kollha tagħhom li jeħtieġu li jiġu identifikati għall-aġġornament.

Għodda kbira għal dan hija Screaming Frog's SEO Spider... forsi l-aktar pjattaforma popolari fis-suq għat-tkaxkir, l-awditjar u l-estrazzjoni tad-dejta minn sit. Il-pjattaforma hija rikka f'karatteristiċi u toffri mijiet ta 'għażliet għal kważi kull kompitu li għandek bżonn.

Screaming Frog SEO Spider: Crawl U Estratt

Karatteristika ewlenija ta 'Screaming Frog SEO Spider hija li tista' twettaq estrazzjonijiet tad-dwana bbażati fuq Regex, XPath, Jew CSSPath speċifiċitajiet. Dan jiġi estremament utli peress li nixtiequ nkaxkru s-siti tal-klijent u nivverifikaw u naqbdu l-valuri MunchkinID u FormId mill-paġni.

Bl-għodda, miftuħa Konfigurazzjoni> Custom> Estrazzjoni biex tidentifika elementi li tixtieq tiġbed.

estrazzjoni tad-dwana screamingfrog

L-iskrin tal-estrazzjoni jippermetti ġbir ta 'dejta virtwalment illimitat:

Screaming Frog SEO Spider Regoli ta 'Estrazzjoni

Estrazzjoni Regex, XPath, u CSSPath

Għall-MunchkinID, l-identifikatur jinsab fl-iskritt tal-formola li jinsab fil-paġna:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

Aħna mbagħad napplikaw a Regola regex biex taqbad l-id minn ġewwa l-iskript tag li tiddaħħal fil-paġna:

Regex: ["']id["']: *["'](.*?)["']

Għall-ID tal-Formola, id-dejta tinsab f'tag ta 'input fil-formola Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aħna napplikaw Regola XPath biex taqbad l-id minn ġewwa l-formola li tiddaħħal fil-paġna. Il-mistoqsija XPath tfittex formola b'input b'isem ta ' formid, allura l-estrazzjoni tiffranka valur:

XPath: //form/input[@name="formid"]/@value

Żrinġ Screaming SEO Spider Javascript Rendering

Għażla oħra kbira ta 'Screaming Frog hija li m'intix limitat għall-HTML fil-paġna, tista' tirrendi kwalunkwe JavaScript li se jdaħħal formoli fis-sit tiegħek. Ġewwa Konfigurazzjoni> Spider, tista 'tmur fit-tab Rendering u tippermetti dan.

Żrinġ Screaming SEO Spider Javascript Rendering

Dan ma jdumx ftit iktar biex titkaxkar is-sit, ovvjament, imma int ikollok formoli li jingħataw min-naħa tal-klijent mill-JavaScript kif ukoll forom li huma mdaħħla min-naħa tas-server.

Filwaqt li din hija applikazzjoni speċifika ħafna, hija waħda oerhört utli għax qed taħdem ma 'siti kbar. Int tkun trid assolutament tivverifika fejn il-formoli tiegħek huma inkorporati fis-sit kollu.

Niżżel Screaming Frog SEO Spider

What do you think?

Dan is-sit juża Akismet biex inaqqas l-ispam. Tgħallem kif il-kumment tiegħek huwa pproċessat.