2024-07-11
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Scrapia est Python compage pro reptando website data et extrahendo informationes exstructas
1.Engine
- Scrapy machinamentum est nucleus moderandi notitiarum fluxus et eventus CT CT. Petitiones ab Araneo missas et responsa recepta, nec non item res ab Aranea generatas dispensat. Machina est vis impulsus post operationem Scrapy.
2.Scheduler
- Schedularius est responsabilis recipiendi petitiones ab machinatione missas, easque per certas rationes (ut prioritas, profunditas, etc.). Cum machina nova postulatione indiget, cedula a queue petitio sumit et ad machinam redit. Ordinate processus petitiones in tuto collocet.
3. Downloader
- Reus est in tractatu de downloading contenti innixa petitionibus ab machina Scrapy missis. Protocollo HTTP utitur ad communicandum cum servo paginae et remittit receptae paginae contentae ad machinam Scrapy pro responsione. Raptor nucleus est pars Scrapy ut paginae notitiae obtineatur.
4.Spiders
- Araneae componentes in Scrapy adhibitis ad logicam reptantium et parse paginae contenti definiendam.Petitiones initiales generant secundum regulas definitas et processum responsionis redditum a receptatore ut data debita extraheret (Item) vel novam petitionem (Request) generant pro ulteriore reptando.
5.Item Pipelines
- Item Pipelines responsales sunt dispensando Items ex aranea extractis. Variis muneribus fungi possunt ut notitia purgatio, notitia simplicium comprobans, notitias in databases vel fasciculos recondens. Plures Pipelines definiendo, notitia mollius ad varias necessitates procedendum est.
6. Download Middlewares
- Mediae instrumenti Downloador inter Scrapy machinam et receptatorem sita est et ad petitiones responsaque tractandas adhibetur. Rogationem mutare possunt (ut petitionem capitis addere, procuratores constituere, etc.) vel responsionem (ut processui compressionis, processus redirectionis, etc.), ita moderantur quomodo Scrapy cum loco interactus est. Medulla machina momenti est ad Scrapy ut suam functionem extendat.
7. aranea Middlewares
– Aranea media cura inter Scrapy machinam et Araneam sita est et ad processum initus (i.e. responsionis) et output (i.e. item et novis postulationibus adhibetur). Possunt responsiones mutare vel abicere, exceptiones tractare, ac etiam mutare vel abicere res et petitiones ab aranearum generatas. Aranea mediae instrumenti facultatem praebet ad munera consuetudinaria inter Aranea executionem inserendi.
Data inter singulas partes influunt in figura ostenditur:
pip install scrapy