Près de 400 journalistes, travaillant pour une centaine de médias dans 80 pays, dont une quinzaine au journal Le Monde, ont travaillé pendant près d'un an pour exploiter la gigantesque base de données des Panama papers.
Plus de cent médias du monde entier ont dévoilé dimanche 3 avril une affaire d'évasion fiscale d'envergure mondiale. Baptisées Panama papers, ces révélations sont d'une ampleur inédite, par le volume des fichiers traités et diffusés. Voici comment, pendant neuf mois, près de 400 journalistes, des médias du monde entier (76 pays) ont structuré les fichiers, les ont épluchés, puis ont recoupé, vérifié et mis en forme les informations contenues dans ces documents.
1 - Se partager le travail
Tout a commencé, comme pour le "Offshore Leaks" en 2013, par une fuite. "Il y a un an de cela, une source anonyme a contacté le Süddeutsche Zeitung et lui a fait parvenir des documents internes cryptés provenant de Mossack Fonseca, un cabinet qui vend des sociétés anonymes offshore dans le monde entier", détaille sur son site le quotidien allemand, qui a été le premier à recevoir les informations.
"Confrontés à l'immensité des données, ils ont décidé de faire appel à un réseau international de journalistes, l'ICIJ (voir notice au bas de cet article, Ndlr), partagés entre une centaine de médias du monde entier", explique Maxime Vaudano de l'équipe des Décodeurs, au Monde, interrogé par BFMTV. Il a également fallu, au cours de réunions à Washington, déterminer le but des recherches au sein des documents.
2 - Structurer les informations
La première difficulté résidait d'abord dans le volume des données. Le quotidien allemand a en effet reçu 2,6 téraoctets de données, "soit plusieurs décennies de lecture jour et nuit si l’on veut aller d’un bout à l’autre de la base de données", précise Le Monde. Ces 11,5 millions de fichiers sont la plus grosse fuite de documents jamais révélée: elle représente 1.500 fois plus que les Wikileaks.
En outre, les informations n'étaient pas toutes organisées sous forme de base de données, de fichiers Excel. Il s'agissait "essentiellement des correspondances internes: des mails, des lettres de la firme Mossack Fonseca. Mais aussi des registres, des documents administratifs, des passeports des clients. Il faut tout fouiller, faire le lien entre ces documents pour voir qui sont les vrais bénéficiaires des sociétés, qui souvent n'apparaissent pas au premier coup d'oeil", décrit Maxime Vaudano.
"Avec notre équipe data, nous avons créé à partir des informations une nouvelle base de données, plus simple à explorer", détaille Gerard Ryle, directeur de l'ICIJ, "une vidéo 'making of' du Süddeutesche Zeitung. C'est là que nous avons commencé nos recherches". Les data journalistes ont recouru à divers logiciels, comme des logiciels de reconnaissance de caractères (OCR), pour extraire le texte des images. Mais aussi à une plateforme d'indexation et d'analyse de données.
3 - Chercher et vérifier les informations
En France, c'est le journal Le Monde et Premières lignes, l'agence qui produit l'émission Cash Investigation, qui ont planché sur les données. Comme il était bien sûr impossible de tout exploiter, il a fallu privilégier certaines informations.
"On a décidé de se concentrer sur certains domaines, sur la France", précise Maxime Vaudano. Les journalistes français expliquent dans un article comment ils ont établi de nombreuses listes de personnalités, comme les parlementaires français, ou les 500 Français les plus riches, les personnalités préférées, les administrateurs du Cac 40, afin de lancer des recherches par filtres dans le fichier.
4 - Diffuser, ou non
Le Monde a choisi de ne pas noyer les lecteurs sous des tonnes de noms, de révélations, mais plutôt de distiller l'information et de la diffuser tout au long de la semaine. Le quotidien français précise également que les noms qu'il divulgue ne le sont qu'au terme d'investigations très poussées, pour s'assurer qu'il ne s'agissait pas d'un homonyme et permettre aux personnalités mises en cause de s'expliquer. Par ailleurs, les informations personnelles que pouvaient receler les Panama papers n'ont pas été diffusées.
Magali RANGIN
Journaliste
Keine Kommentare:
Kommentar veröffentlichen