|
Elysée 2007, la Web campagne et les blogs stockés par l'Ina - 12 mai 2007 - 13:06 (Par Etienne Jean de la Perle)
L'institut national de l'Audiovisuel (Ina) vient d’annoncer une nouvelle mission qui vient de lui être confiée. Il s’agit pour l’Ina de réaliser un travail colossal d'archivage des sites Internet mais aussi des blogs relatif à la récente élection présidentielle 2007, et à la course à l’Elysée. Ainsi, l’Ina va stocker pas moins de 80 millions URL sur Internet dont plus de 15 000 vidéos hébergées à près de 90% d'entre elles par Dailymotion. Dès la fin 2006 l'Ina s'est mis en situation de créer une archive, très large et très actualisée, de l'image de la campagne présidentielle sur le Web, la Web campagne. C’est en s'appuyant sur les travaux de la société Réseaux, Territoires & Géographie de l'Information (RTGI) que l’Institut national de l’audiovisuel a défini le périmètre du corpus des sites Internet et des blogs relatifs aux élections présidentielles.
L’Ina précise que ce corpus intègre les sites Internet et blogs actifs, ainsi que les sous-sites et forums politiques des principaux médias. Il est passé de 1400 sites en début de campagne à plus de 2200 depuis la mi-mars. RTGI a mis en place le site observatoire-presidentielle.fr, qui présente une analyse cartographique (blogopole) et statistique (tendençologue) de ce corpus. Ce sont ains 80 millions d’URL qui ont été collectées au cours de la campagne de la présidentielle, dont plus de 15 000 vidéos hébergées pour près de 90% d’entre elles par Dailymotion, soit près de 700Go de stockage compressé et dédoublonné, dont plus de 300Go pour les seules vidéos, dans le format de stockage DAFF développé par l’Ina. L’opération de collecte des sites Internet et URL de blogs ayant traité la course à l’Elysée de 2007 a commencé le 26 janvier. Depuis le mois d’avril, les 500 principales pages de chaque site sur le Web ont été collectées jusqu’à 4 fois par jour, une collecte plus profonde étant menée tous les trois jours environ, et une collecte complète chaque mois. 220 versions de chaque site Internet auront ainsi été captées en moyenne, à différentes profondeurs, au cours de la campagne présidentielle de 2007. Les pages d’accueil des sites Web ont été captées toutes les 15 minutes pendant les 2 dimanches des élections, afin de suivre l'évolution des tendances dès connaissance des premiers chiffres et sondages. Retrouvez toutes les actualités de l'Internet, de l'informatique, des sciences du jour
Mentions légales | Nous contacter | Qui sommes-nous ? | Chiffres-clé | Recommander ce site | Partenaires | Liens divers Internet |
Communiqués de presse
Vous souhaitez nous communiquer vos actualités, nouveaux produits, manifestations,..., en matière d’informatique, de matériels high-tech, d'avancées scientifiques, …, envoyez-nous vos communiqués de presse.
Publicité Forum : Vos réactions Vous souhaitez réagir à un article, ouvrir le débat sur un thème qui vous est cher... > Participez au forum du référencement Nos flux RSS Vous souhaitez intégrer nos flux Tous nos flux RSS > ici ! |
||||||
| © RecyConsult / 2008 - Enregistré à la CNIL n°893989 | |||||||
![]() | Tous droits de reproduction et de représentation réservés. Toutes les informations reproduites sur cette page (contenus, photos, logos .) sont protégées par des droits de propriété intellectuelle détenus par RECYCONSULT. Aucune de ces informations ne peut être reproduite, modifiée, transmise, rediffusée, traduite, vendue, exploitée commercialement ou réutilisée de quelque manière que ce soit sans l'accord préalable écrit de RECYCONSULT. | ||||||