Scrapy software | |
---|---|
Genere | Web Crawler (non in lista) |
Sviluppatore | Scrapinghub, Ltd. |
Data prima versione | 26 Giugno 2008 |
Ultima versione | 1.8.0 (28 Ottobre 2019) |
Sistema operativo | Microsoft Windows macOS Linux |
Linguaggio | Python |
Licenza | Licenza BSD (licenza libera) |
Sito web | scrapy.org |
Da non confondersi con Scrapie
Scrapy (/ˈskreɪpaɪ/ SKRAY-PEYE ) è un framework open source per web-crawling scritto in Python. Originariamente creato per web scraping può essere anche utilizzato per estrarre dati usando delle API oppure come un web-crawler general-purpose[1]. È mantenuto da Scrapinghub Ltd., uno sviluppatore di web-scrapers e compagnia di servizi.
L'architettura del progetto di Scrapy consiste in "ragni", che sono web-crawler che sono dati un set di istruzioni. Seguendo lo spirito di framework don't repeat yourself, come Django[2], rende semplice costruire e scalare progetti di crawling grandi, concedendo agli sviluppatori di riutilizzare il loro codice. Scrapy offre anche una shell per web-crawling, che può essere usata dagli sviluppatori per testare delle assunzioni su un comportamento di un sito[3]. Alcune compagnie conosciute utilizzano Scrapy come: Lyst[4][5], Parse.ly[6], Sayone Technologies[5], Sciences Po Medialab[7], Data.gov.uk.