Organiser sa Veille sur Internet, Au-delà de Google…
Catégorie de l'article : | Aucun Commentaire | 80 Vues
La veille n’est pas qu’une activité de lecture histoire de se tenir informé de ce qui se passe. La veille, c’est rechercher à connaitre ou à comprendre un processus, un outil, un domaine de manière anticipative. La veille est un processus volontaire.
De tout temps, la veille n’a jamais été un simple passe temps. Avec l’avènement de l’internet, la veille est devenu un travail à plein temps.
La taille du web est d’environ 52 000 000 000 de pages. Enfin, je devrais plutôt dire que Google à indexé ces 52 milliards de pages. Mais saviez-vous qu’on estime que cela ne représente que 0,3 % du web dans son ensemble ?
Si la veille est essentielle, trouver la bonne source d’information, la suivre, la traiter et la diffuser sont devenu autant de point qu’il vous faudra maitriser pour arriver à bon port.
Organiser sa veille sur internet , au-delà de Google… possède un sous-titre légèrement flou Outils et astuces pour le professionnel. Oui ce livre fourmille bien d’outils et d’astuces. Le terme professionnel ne doit pas être entendu comme professionnel documentaliste, mais professionnel dans le sens utilisation de la veille à but professionnel.
Vous me direz, ca tombe plutôt bien, je suis pas documentaliste.
Gardez juste à l’esprit que ce livre tente de vous guider au travers d’outils accessible à tous, bien que des outils onéreux puissent également exister, le parti prit est de ne pas se focaliser sur eux.
Les plus du livre Organiser sa veille sur Internet, Au-delà de Google
De petite taille, et composé de 320 pages, ce livre est agréable à manipuler. Seule la couverture semi rigide sera embêtante pour ceux parmi vous aimant plier un livre en deux. Vous risqueriez de lui faire passer l’arme à gauche !
Abondamment illustré d’images en noir et blanc, ce livre est agréable à lire.
Quatre pivots fondamentaux guide l’écriture de ce livre :
- La préparation de la veille,
- La collecte de données,
- Le traitement des données et l’organisation de l’information,
- La diffusion de l’information.
L’axe d’écriture est intéressant car il ne s’agit pas ici de faire une liste exhaustive de tous les outils mise à votre disposition. Ce livre se propose d’aller un peu plus loin en incluant la veille dans un tout. Toutefois, ce livre est aussi un recueil de bonnes adresses web. Et comme tout recueil, ceux connaissant bien le web n’en découvrirons pas énormément. L’intérêt des connaisseurs pour se livre se trouvera plus dans la manière dont il vous propose de traiter, collecter et diffuser vos trouvailles.
Zoom sur Organiser sa veille sur Internet : le web Invisible
Le web invisible est abordé au chapitre 7 de Organiser sa veille sur Internet.
Nous vous le disions en préambule, le nombre de pages indexées par des géants comme Google approche les 52 000 000 000 de pages. C’est impressionnant. Et pourtant, cela ne représenterait que 0,3% de la totalité du web. Rendez-vous compte, 99,7% des données présentes dans le web serait hors de votre portée si vous vous contentez d’utiliser un moteur de recherche tel Google.
Cela s’explique pour deux principales raisons :
- Le web est vivant. Les pages naissent et meurent.
- L’URL de la page est inconnu à Google.
Des outils existent pour vous permettre aussi bien de retrouver une page disparue, que pour découvrir des pages que Google ne connait pas.
Les pages qui disparaissent sont une plaie sur le web. Bien que le web nous donne une impression d’immuable, rien n’est moins vrai. Des milliers de pages, et le contenu qui va avec, disparaissent tous les jours. Le premier outil à votre disposition et celui mis à votre disposition par Google grâce à son système de mise en cache. Cependant, cela s’avère parfois trop léger.
La wayback machine c’est l’arme de guerre pour retrouver des pages qui auraient malencontreusement disparues. Bien que perfectible, il s’agit ici d’un service mis en place par archive.org, dont le but est… d’archiver le web.
Pour les amoureux du Panda Roux, l’extension Resurrect Pages vous permettra de retrouver plus de 90% de pages vous renvoyant un beau 404.
Parmi le web dit invisible, nous avons le web profond, qui n’est pas indexé par les moteurs de recherche pour plusieurs raisons :
- Le principe de l’hypertexte n’est pas mis en place, ou pas de sitemap, le moteur n’arrive pas à trouver le contenu.
- Le fichier robots.txt restreint l’accès à ces pages.
- La page est créée en dynamique, en Ajax.
- Les pages sont faites sur un support non ou mal indexable tel le Flash.
- Le javascript vient tout casser pour les moteurs.
Heureusement, des moteurs de recherche spécialisés dans le web profond existe tel :
- Dadi
- Budl Link
En résumé
Il s’agit d’un livre au bon rapport qualité prix ( une vingtaine d’euros) qui vaudra le coût pour tout ceux désirant pousser plus loin la compréhension du web en général et la maitrise des outils pour y parvenir. Le seul reproche que je ferais à ce livre et de ne pas assez s’attarder sur l’ensemble de liens cités. Cela aurait certainement fait grossir le livre et le prix, mais cela pourrait se justifier aux yeux de tous ceux désirant ne pas décrocher du livre durant la lecture.
Un livre simple d’appréhension qui offre ce qu’il prétend, des outils et astuces pour votre veille.
Il suffit de cliquer sur l'un de ces boutons :











