Spidering Hacks

Non è un libro recentissimo (è stato infatti pubblicato nel 2003) ma rappresenta in assoluto una novità per gli argomenti introdotti.

Si pone infatti il problema di far capire l’arte dello spidering e quindi di come reperire informazioni (anche personalizzate) in quel mare magnum che è il web.

Il libro mostra come sia possibile realizzare piccoli spider personalizzati (ossia software in grado di effettuare ed automatizzare ricerche per noi) utilizzando diversi linguaggi di programmazione (java, perl, python e le rispettive librerie java.net, urllib, lwp etc )

Scrivendo un nostro spider possiamo monitorare un sito che ci interessa per prelevare informazioni o semplicemente verificare eventuali aggiornamenti dello stesso, oppure verificare che i siti con i quali abbiamo effettuato una campagna di scambio link abbiamo effettivamente ancora un link al nostro sito e molto altro (i limiti risiedono solo nella creatività personale).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *