Capturer des contenus Scrapbook, HTTrack, Spiderzilla

Objectifs

Sélectionner les ressources internet accessibles aux élèves : ● Capturer et d'organiser une liste de pages internet ● Capturer et organiser un site internet entier

Logiciels à installer

● Scrapbook est une extension du navigateur Mozilla, qui permet d'effectuer de façon simple la capture et l'archivage des pages visitées. Il faut donc installer Mozilla ( http://www.mozilla-europe.org/fr/products/firefox/ ) et aller à cette adresse pour installer Scrapbook : ://addons.mozilla.org/firefox/ (taper « Scrapbook » dans la zone de recherche)

● HTTrack est un aspirateur de site libre disponible à cette adresse : http://www.httrack.com/index.php

● Pour lancer directement une capture de site à partir de Mozilla Firefox, il est commode d'installer l'extension « Spiderzilla » pour Firefox : https://addons.mozilla.org/firefox/ (taper «Spiderzilla» dans la zone de recherche)

Capturer des pages isolées et les organiser avec Scrapbook

Présentation

Scrapbook se présente sous la forme d'un panneau latéral qu'on peut ouvrir comme ceci :

Il est plus rapide de l'ouvrir en cliquant sur un bouton qu'on peut placer dans la barre de boutons de la façon suivante : clic droit sur la barre de boutons, puis « Personnaliser ». Glisser ensuite le bouton « Scrapbook » à l'endroit voulu de la barre.

Les pages capturées seront donc présentes dans ce panneau latéral, et aussi dans le menu scrapbook de la barre de menus.

© [email protected] Capturer des contenus internet 1/4 Capture

Il suffit de visiter la page à capturer, puis :

● soit cliquer sur ● soit faire glisser l'icône située à côté de l'adresse « Scrapbook », vers le panneau latéral « Capture de la page »

Organisation

Les pages capturées seront faciles à organiser grâce au panneau latéral qui permet de : ● créer des dossiers ● déplacer les pages dans les dossiers ● renommer les pages

Dans ce panneau latéral, le menu « Outils » « Paramètres » permet de régler l'emplacement des sauvegardes des pages capturées.

Dans l'exemple ci-contre, on choisit un dossier réseau, ce qui permet que tous les postes d'une même salle puissent accéder aux mêmes pages alors que celles-ci n'ont été capturées que sur un ordinateur.

2/4 Capturer des contenus internet © [email protected] Capturer un site avec HTTrack

Capture simple

Lors du lancement, le logiciel propose la capture d'un site. Dans cette fenêtre, donner un nom explicite à la capture, et indiquer le dossier qui recevra la copie.

la copie peut être effectuée dans un dossier de travail, ici sur le bureau, puis ensuite déplacée

Dans cette fenêtre, entrer l'adresse de la page d'accueil du site (l'adresse peut être copiée/collée depuis le navigateur internet). Pour un premier essai, laisser les options de base.

Cette fenêtre permet de surveiller la capture : si le nombre de liens restant à parcourir semble trop important, ou que la capture s'éternise, ou que le nombre d'octets écrits semble démesuré, il faudra annuler la capture, puis définir des options plus restrictives avant de la relancer.

© [email protected] Capturer des contenus internet 3/4 Réglages supplémentaires

Dans l'un des cas précédents, il faudra diminuer le nombre de liens à capturer, en utilisant la fenêtre d'options.

Cet onglet permet de régler le nombre de liens capturés depuis la page d'accueil (profondeur) : le premier réglage concerne les pages internes du site capturé (en général, il est souhaitable de les conserver). Le second réglage concerne les liens externes vers d'autres sites : ce sont ces liens qui peuvent être la source d'ennuis et conduire à des captures énormes et non pertinentes.

On peut également fixer une taille ou un temps à ne pas dépasser, mais ceci coupera la capture avant des pages souhaitables.

Ici, on peut exclure certains types de fichiers. Il peut être utile et plus économique de ne pas capturer les vidéos et les sons (mov, mpg,...), ainsi que les fichiers archives (zip,...)

Capturer un site avec Spiderzilla

Dans Mozilla Firefox, il suffit de lancer la capture par un clic droit, puis

Une fenêtre permet ensuite d'effectuer les mêmes réglages que précédemment.

4/4 Capturer des contenus internet © [email protected]