Back to Question Center
0

Vadnica za spletne brskalnike Chrome Iz Semalt Expert

1 answers:

Če uporabljate Google Chrome, obstaja razširitev za vaš brskalnik ki lahko pomagajo strgati spletne strani. Znana je kot "Scrapper" in jo je mogoče brez težav uporabiti. Scrapper bo pomagal pri strganju vsebine spletnega mesta in prenosu rezultatov v Googlove dokumente.

Kako odstraniti spletno mesto z razširitvijo strgala?

1. Izberite Chrome Spletno trgovino v Google Chromu;

2. V razširitvah izvede iskanje "Scrapper";

3. Prvi iskalni rezultat je razširitev, imenovana "Scrapper";

4. Izberite gumb, ki je naveden kot »Dodaj v Chrome«;

5. Vrnite se v seznam poslancev Združenega kraljestva;

6. Kliknite naslednje ;

7. Sedaj poiščite enega MP in zagotovite, da je vnos označen;

8. Z desno miškino tipko kliknite "Scrape Podobno ... "

9. Konzola za skutere se bo pojavila v drugem oknu;

10. Oglejte si očiščeno vsebino v strgalniku konzola,

11. Če želite zagotoviti, da se vsebina shrani kot Google Preglednica, izberite »Shrani v Google Dokumente ...«

Razširjeno strganje

Preden pridruži temu receptu , je koristno razumeti osnove HTML-ja. Na primer, lahko preberete kratek uvod v HTML preko te povezave

. Zamislimo si, da nas zanima vse filme, ki so igrali z zvezdico Asia Argento, znana italijanska igralka

1. V IMDB je zelo podroben arhiv akterjev. Spletna stran Asia Argento je: https://www.imdb.com/name/nm0000782/;

2. Tu si lahko ogledate vse vloge igralke..Začnimo z uničenjem informacij, ki nas zanimajo;

3. Poskušajte ga ostružiti tako, kot je opisano zgoraj;

4. Videli boste, da je seznam malo popačen. To je posledica dejstva, da je seznam tukaj lahko drugače strukturiran;

5. Pojdite na strgalno konzolo. V zgornjem levem kotu, boste videli majhno polje, ki pravi XPath;

6. Xpath je vrsta jezika poizvedbe, ki deluje za XML in HTML;

7. XPath lahko pomaga poiskati dele strani, na katero se zanimajo. Naslednja stvar je najti ustrezen element in napisati XPath za to;

8. Zdaj pa uredimo našo mizo;

9. Videli boste, da je naš obstoječi XPath, ki ima vse potrebne podatke, "// div [3] / div [3] / div [2] / div";

10. XPath obvesti sistem, da si ogleda dokument HTML in izbere tretji element, nato drugi element in nato vse;

11. Želimo si, da bi bili podatki ločeni;

12. Uporabite razdelek stolpcev v konzoli za skutere, da to naredite;

13. Najprej najti naš naslov »Uporabi pregled elementa«, da si ogledate naslov;

14. Označite naslov znotraj oznake. Dodajte oznako na XPath;

15. Zdi se, da izraz deluje ustrezno, zato naj bo naš prvi stolpec;

16. V rubriki »Stolpci« zamenjajte ime prvega stolpca na »naslov«;

17. Dodajte mu XPath;

18. V stolpcu so XPathi relativni in pomeni, da bo "./b" izbral element 91

19. V XPath za naslovni stolpec dodajte »./b« in izberite »strganje«;

20. Zdaj nadaljujemo še eno leto. Leta je mogoče najti v enem razponu;

21. Ustvarite nov stolpec tako, da izberete majhen plus poleg stolpca za svoj naslov;

22. Uporaba XPath "./span" ustvarite stolpec za "leto";

23. Kliknite strgalo in si oglejte, kako je bilo leto dodano;

24. Sestavljeno!

5 days ago
Vadnica za spletne brskalnike Chrome Iz Semalt Expert
Reply