Дастурамали Chrome Web Scraper аз Semalt Expert

Агар шумо Google Chrome-ро истифода баред, васеъкунии браузери шумо вуҷуд дорад, ки метавонад ба пошидани веб-саҳифаҳо кӯмак расонад. Он ҳамчун '' Скрепер '' маъмул аст ва онро бе мушкилот истифода бурдан мумкин аст. Скреппер дар таҳқири мундариҷаи вебсайт ва интиқоли натиҷаҳо ба ҳуҷҷатҳои Google кӯмак хоҳад кард.

Бо истифода аз тамдиди Scraper як вебсайтро чӣ гуна каҷ бояд бурид?

1. Store Web Store -ро дар Google Chrome интихоб кунед;

2. Дар васеъкунӣ, ҷустуҷӯи '' Scrapper '' иҷро кунед;

3. Натиҷаи аввалини ҷустуҷӯ ин васеъкунӣ бо номи '' Scrapper '' мебошад;

4. Тугмаеро, ки дар рӯйхати '' Илова ба Chrome 'рӯйхат шудааст, интихоб кунед;

5. Ба рӯйхати вакилони Британияи Кабир баргардед;

6. Истиноди зеринро зер кунед ;

7. Ҳоло як ВП-ро ҷустуҷӯ кунед ва ворид шудани аломат қайд карда шавад;

8. Бо интихоби рости "Scrape Similar ..." тугмаи ростро клик кунед;

9. Консол барои скрепер дар равзанаи дигар кушода мешавад;

10. Намоиши мундариҷаи харошидашуда дар консоли скрепер;

11. Барои кафолати нигоҳ доштани мундариҷа дар ҷадвали Google, "Захира ба Google Docs ..." -ро интихоб кунед.

Кашидани васеъкунӣ

Пеш аз он ки ба ин дорухат часпед, фаҳмидани асосҳои HTML мебошад. Масалан, шумо метавонед дар ин пайванд шиносномаи кӯтоҳро ба HTML хонед

Биёед тасаввур кунем, ки мо ба ҳама филмҳое, ки ситораи маъруфи итолиёвии итолиёвӣ "Аргентина" -ро офаридааст, шавқмандем.

1. Дар IMDB бойгонии хеле хуби фаъолон мавҷуд аст. Сайти Asia Argento: http://www.imdb.com/name/nm0000782/;

2. Дар ин ҷо, шумо метавонед ҳамаи нақшҳои ҳунарпешаро бозед. Биёед кам кардани маълумоти ба мо маъқулро оғоз кунем;

3. Кӯшиш кунед, ки онро тавре, ки дар боло тавсиф шудааст, буред;

4. Шумо хоҳед дид, ки рӯйхат каме таҳриф шудааст. Ин ба он вобаста аст, ки рӯйхат дар ин ҷо мумкин аст ба таври гуногун сохтор карда шавад;

5. Ба консоли скреперҳо. Аз чап, шумо қуттии хурдеро мебинед, ки XPath мегӯяд;

6. Xpath як навъ забони дархостест, ки барои XML ва HTML кор мекунад;

7. XPath метавонад дар ёфтани қисмҳои саҳифаи ба шумо маъқул кӯмак кунад. Ояндаи дигар ёфтани унсури мувофиқ ва XPath барои он аст;

8. Акнун биёед мизи худро тартиб диҳем;

9. Шумо хоҳед дид, ки XPath-и мавҷудаи мо, ки тамоми маълумоти зарурӣ дорад: "// div [3] / div [3] / div [2] / div";

10. XPath ба система маълумот медиҳад, ки ҳуҷҷати HTML-ро бинад ва унсури сеюмро, пас унсури дуюмро ва баъд ҳамаашро интихоб кунад;

11. Аммо, мо мехоҳем маълумоти худро ҷудо кунем;

12. Бахши сутунҳоро дар консол барои скрепер истифода баред, то ин корро анҷом диҳед;

13. Биёед аввал сарлавҳаи худро ёбем

14. Сарлавҳаро дар барчасп тафтиш кунед. Замимаро ба XPath илова кунед;

15. Чунин менамояд, ки ибора ба таври мувофиқ кор мекунад, бинобар ин онро сутуни якуми мо созед;

16. Дар қисми "Сутунҳо" номи сутуни якум ба "унвон" иваз карда шавад;

17. XPath-ро ба он илова кунед;

18. Дар боби сутун, XPaths нисбӣ мебошанд ва маънои онро дорад, ки "./b" унсури <b> ро интихоб мекунад

19. Дар XPath барои сутуни унвон "./b" илова кунед ва "харошидан" -ро интихоб кунед;

20. Акнун биёед як сол давом кунем. Солҳоро дар як фосила ёфтан мумкин аст;

21. Сохтани сутуни нав бо интихоби плюс хурд дар назди сутуни унвон;

22. Бо истифодаи XPath "./span" як сутун барои "сол" эҷод кунед;

23. Скреперро клик кунед ва бубинед, ки сол чӣ гуна илова карда шуд;

24. Иҷро кунед!