Ruby, et le screen-scraping

February 7, 2007

D’abord j’ai lu ce petit article qui explique comment écrire un screen-scraper en ruby et avec Hpricot rapidement… A la fin il y’a plusieurs liens, dont un vers le blog d’un programmeur python qui s’est amusé à ré-écrire la même chose dans son langage favori (en Fourchelang donc).

Il y’a quelques jours j’ai écris un petit outil sur le même sujet, parce que je jouais aussi avec Hpricot, parce que HTML-Parser n’est plus du tout maintenu, et parce que Hpricot caibon mangézan (doublement). Bref, ça s’appelle trouvage (in english, sorry). C’est mignon, ça me sert surtout à moi – d’où le nom idiot – et c’est marrant pour faire des sottises du genre :

trouvage www.google.fr/search?q=fourchelang -e '//a[@class=l]'

… qui vous affiche gentiment les 10 premières URLs retournées par Google- France lorsque vous cherchez Fourchelang. Je m’ennuie un peu au boulot pour l’instant, il faut bien que je m’amuse. :)