Retour

Le « hack » pour personne âgée et la sécu !!


Le « hack » pour personne âgée et la sécu !!

Version 15 juin 2013

Les sites

Certains sites proposent des téléchargements, malheureusement il faut sans cesse cliquer et a la longue c'est le risque d'attraper le syndrome du canal carpien (scc).

Pire l'énervement des pubs peut faire monter la tension jusqu'à l'anévrisme...

En plus c'est du temps perdu, a un age certains ça compte,

Un chargement rapide c'est payer, mais avec la retraite de bientôt!!...

Hack ou vol ?

Les données sont librement disponible, il n'y a donc pas vol, mais puisque l'on place en face de nous un robot, nous obligeant a cliquer sans cesse, pourquoi ne pas faire de même, la réponse du berger a la bergère !!.

Parenthèse...

Pour le téléphone, les robots et la bergère, la version « vintage » consiste a inclure dans le début du message de son répondeur la tonalité * et # ainsi le robot qui vous téléphone croit votre présence, et vous passe la « liseuse » de pub, qui parle a votre robot : votre répondeur !!

Fin de la Parenthèse...

Windows ou Ubuntu (linux)

Rapidement on constate que les solutions windows sont payantes, et « obscures », alors qu'avec linux, c'est beaucoup plus ouvert et gratuit.

Ubuntu peut s'installer en « complément » a Windows, pour les accros... On peut ainsi démarrer soit avec l'un soit l'autre.

Dans la suite on considère être sous Ubuntu, certains programmes existent sous les deux systèmes.

Idées pour préserver sa santé et sa bourse!!.

Le bon choix ?.

Choisir entre cliquer 10 heures ou réfléchir 4, et avec cela le plaisir d'avoir trouvé plutôt que de devoir se passer de la crème sur ses articulations...

En plus réfléchir c'est bon pour les neuronnes.

La fausse liberté de l'interface graphique.

Pour l'utilisateur, cet interface rend simple l'utilisation de l'ordinateur, mais est en fait il est très limité.

Il est impossible d'effecteur des traitement, par exemple un simple filtre sur tous les fichiers qui auraient un a en 3ieme lettre, un exemple stupide peut être mais explique le problème.

En « Linux » ou «dos » en mode console, chacun a ses langages pour ces types de traitements, très utilisé pour la gestion des systèmes, pour Linux c'est le BASH.

Il existe aussi le Python ou le Pearl. 

Les méthodes

L'aspiration du site

La plus simple des solutions consiste a "aspirer" le site, des aspirateurs existent il suffit de mes trouver, une simple recherche google suffit (Windows).

Ce principe fonctionnait auparavant, mais les sites avec le PHP l'on rendu quasi impossible.

WGET est la commande qui permet d'aspirer un site, mais la encore le résultat peut ne pas être celui attendu.

L'aspiration de fichier

Des outils existent, l'un des plus connu est "CURL".

Ces deux outils offrent une multitude d'options, il suffit de faire wget --help dans la fenetre terminal.

Le BASH

C'est un affreux langage de programmation, heureusement il y a des gourous, et j'en suis pas un !.

Grace a eux, toujours disponible il suffit (en Anglais) de poser la question à goggle en commençant par « bash » pour avoir la réponse.

Et la réponse est toujours la ! (dans un forum lointain).

Si il est toujours présent c'est qu'il a un avantage : il suffit de quelques lignes pour faire le traitement, encore faut il les écrire...

Evidemnt la connaissance de la langue anglaise est un plus, mais on trouve de l'aide aussi en Francais.

Récuperation, le principe de base

Les sites utilisent des stratagèmes pour cacher l'adresse des fichiers, une fois trouve, il y a des chances pour que CURL puisse le télécharger.

Exemple pratique 1

Dans cet exemple on peut récupèrer :

-des bruitages

-des fontes de caractères

-des textures

le site « soundbible.com » est en PHP, l'utilisation d'un aspirateur sera un echec.

Mais en analysant les requêtes, on constate que celle-ci est de la forme :

"http://soundbible.com/grab.php?id=1&type=mp3"

le id=1 indique le son, il suffit d'aller de 1 a 2500 !

la commande CURL:

curl "http://soundbible.com/grab.php?id=[1-2050]&type=mp3" -omusic#1.mp3

permet de télécharger les sons...

le nom sera music.mp3

Avec cette méthode on peut aussi récupérer les wav, mais aussi les fontes les textures.

La suite...

Malheureusement, avec music.mp3 on ne connait pas le nom du bruitage...

Afin de le récupérer, on va envoyer des requêtes avec une erreur ; pas de « &type=mp3 »

curl "http://soundbible.com/grab.php?id=[1-2050]" -osound#1Name.txt

On a maintenant pour chaque son deux fichiers, l'un contient le son l'autre le nom.

Reste plus qu'a analyser le second pour renommer le premier, autant dire que « l'interface grapique » n'est pas a la hauteur....

Les expressions régulières

Avec le BASH, c'est un autre élément qu'il faudrait maitriser !.

En fait c'est un langage permettant de réaliser des règles de grammaires.

Voici un exemple, dans le fichier des noms, celui-ci est comme cela :

...failed for LENOM in ZZ....

Pour extraire LENOM dans le fichier on utilise la commande :

NameN=$(sed -n 's/.*failed for\ \(.*\). in ZZ .*/\1/ip' $i)

note: le ZZ etait un inf b sup, suprimé car interpreté comme debut en caractere gras en html!.

le pure bash, évidement même après l'avoir écrit, peut poser problème de compréhension !!.

Voici l'explication de cette ligne, SED est un éditeur de texte, $i contient le nom du fichier qu'il va éditer, et mettre le résultat dans NameN.

's.. est la commande pour substituer le failed... par seulement le nom du fichier, c'est s/ quoi/autre_chose/ip' (ip sont des options).

Reste l'expression régulière, la règle de grammaire :

.(tout caractre)*(repeté autant de fois jusqu'à)failed for \( (on va garder cela\) (la suite). inZZ. Le \1 c'est le premier (le seul) qu'on a garger qu'on va mettre dans NameN.

Apres cela on comprend qu'écrire cette ligne peut prendre du temps, et de l'aide !!.

La suite...de la suite le BASH

Exemple pratique 2

La methode utilisé qui consiste a analyser la page afin de reconstruire les requetes peut en l'automatisant (en bash) permettre de recuperer un site a menus en chaine.

A suivre...

Page Web X.Fenard
(c) Xavier Fenard 2013

Retour