Vai al contenuto

Che cos’è il web scraping e a cosa serve?

    Molti siti web contengono informazioni che possono essere utili per migliorare le attività commerciali e marketing come, per esempio, le quotazioni azionarie il dettaglio di prodotti di E-commerce, statistiche di vario genere e contatti aziendali.

    Per recuperare questo tipo di informazioni, sarebbe necessario entrare in ogni singola pagina del sito web dal quale vogliamo estrarre dati per poi copiare incollare dati su un foglio di Excel; credo di non essere smentito dicendo che almeno una volta nella nostra vita lavorativa questa è un’operazione che abbiamo compiuto.

    Il web scraping è fondamentalmente un’attività automatizzata di estrazione dati che ci permette di raccogliere in pochissimo tempo tutti i dati di nostro interesse praticamente da tutti i siti web pubblicati.

    Si tratta quindi di un’azione automatizzata di estrazione dati da un sito web che vengono esportati nel caso più semplice, in formato Excel per poi poter essere utilizzati in altro modo.

    Con buone conoscenze di programmazione informatica, è possibile eseguire lo scraping in maniera che possiamo definire manuale ma, nel caso di grandi mole di dati da estrarre, è evidentemente più utile utilizzare delle automazioni.

    Fino a qualche anno fa lo scraping poteva essere considerata un’azione relativamente semplice ma con l’evoluzione delle tecnologie per la realizzazione dei siti web, oggi l’attività di web scraping necessità competenze e conoscenze informatiche di una certa rilevanza.

    Spesso mi viene chiesto se lo scraping è illegale, la risposta a questa domanda è che non lo è, semmai potrebbe essere considerato poco etico; è considerato illegale quando vengono estratti dati non pubblicati su pagine web in chiaro.

    Come funzionano i web scraper?

    La logica di funzionamento di un’attività di web scraping non è così complessa.

    Si tratta fondamentalmente di fornire all’automazione di scraping una serie di pagine web che contengono i dati di nostro interesse; una volta identificati i dati da estrarre dalla pagina web, l’automazione sì occuperà di estrarli e di creare un file Excel.

    L’azione di scraping non estrarrà tutti i dati presenti nella pagina web oggetto dell’azione ma saranno estratti solo i dati di nostro interesse, per esempio, da un sito di una fiera, potremmo estrarre tutti i dati degli espositori dove spesso e volentieri sono presenti il nome dell’azienda, l’indirizzo, la nazione, una descrizione, il sito web e l’indirizzo di posta elettronica oppure da un sito di un’associazione di categoria, potremmo andare ad estrarre i dati degli associati.

    Strategia per la generazione di contatti commerciali

    Funnel B2B

    L’immagine mostra la mia personalissima strategia per la generazione di contatti commerciali per il mercato B2B dove i primi sei box in alto possiamo definirli punti di contatto, vale a dire le fonti che contengono i dati del nostro target.

    Nel caso di linkedin e del Sales Navigator, è possibile automatizzare l’aumento della rete grazie all’invio di circa 1.500 richieste di connessione al mese che statisticamente possono generare circa 7/800 utenti in target che accettano di entrare nella nostra rete professionale e, di conseguenza, potremmo successivamente estrarre i loro dati di contatto; 800 utenti in target al mese che accettano di entrare nella nostra rete, significa poter disporre in un anno di un potenziale di circa 10.000 lead in target.

    Il secondo box è costituito da specifici scraper che possono estrarre dati direttamente da Linkedin e che possono confluire in un file Excel che potremmo chiamare “Social CRM Database”.

    Gli ultimi quattro box dei punti di contatto, dati da camere di commercio, directory verticali, fiere di settore e associazioni di categoria, possono essere oggetto di attività di scraping vale a dire che possiamo individuare il nostro target al loro interno ed estrarre i dati sensibili; il file generato potremmo chiamarlo “Scraper Database”.

    Una volta creato il database di utenti in target, possiamo passare alla fase commerciale dell’attività per la generazione di contatti commerciali vale a dire creando una DEM che contenga una call to action, una landing page ed eventualmente una thank you page.

    Questa procedura si adatta a qualsiasi mercato geografico e a qualunque azienda operi nel B2B sia in Italia che all’estero.