e-Mails, datenbanken, tabellenkalkulation, kopien der ausweise, briefe : alle daten wiederhergestellt amerikanische konsortium investigativer ICIJ komponente "OffshoreLeaks" verwendet, Das von der Welt und anderen internationalen medien ist schwindelerregend.

So finden sie den weg in die 2,5-millionen-dateien, die sich in seinem besitz, die ICIJ hatte, um eine vorbehandlung, bevor daraus eine nutzbare information. Denn im gegensatz zu WikiLeaks, wo die dateien strukturiert waren, dargestellt in der gleichen weise, die dokumente sind hier vielfältig und die behandlung konnte nicht automatisiert werden. Mehrere programme wurden daher verwendet werden, zu sehen, die speziell für die ICIJ.

Eine texterkennungssoftware (OCR) ermöglichte die umsetzung digital wird der text in die bilder, die ausweise und sonstige dokumente gescannt. Die datenbanken gefunden werden sowie aufgefüllt und anschließend ausgeschöpft werden.

software free text retrieval (FTR) profis haben es ermöglicht die suche in allen dateien, isolieren eigene namen und/oder adressen, zum beispiel. Diese programme erkennen in den dateien, die features wie einen eigenen namen und eine adresse und die indexiert wird, um die suche zu beschleunigen.

händigen mehrere spezielle programme von data-mining-tools ausgrabung in der datenbank. Ein skript zum zuordnen von namen und adressen, und entfernen sie doppelte dateien entwickelt wurde, sowie ein weiteres für die automatische zuweisung land-datei analysiert.

"GEDULD"

Eine manuelle auswahl in diesen dateien hat daher erlaubt, die verteilt werden, je nach land mit insgesamt 122 000 offshore-unternehmen aufgeführt und 130 000 einträge von personen, die im besitz, kontrolliert oder verbergen sich hinter diesen unternehmen

Diese informationen werden dann mitgeteilt, in den medien partner der aktion, jeweils mit den daten über sein land.

ab, die die navigation in der datenbank mit dem namen WEGLÄSST, ist nicht einfach. Es erfordert, für den journalisten, der unterstützung von personen, die ICIJ.

Vor der multiplikation der anzahl der partner, eine dedizierte schnittstelle, genannt Interdata, entwickelt wurde, in weniger als zwei wochen. Die dokumente werden können, werden gesucht und heruntergeladen werden durch die ermittler der wertpapiere partner.

Die schnittstelle, sichere, ist offen für journalisten : sie erledigen mehr als 28 000 suche, upload von mehr als 53 000 dokumente.

Die suche wird sie nicht so vereinfacht. Namen werden nur selten auf dem bildschirm, aber diese dateien können sie geduldig wahlwiederholung der leinwand in verschiedenen bearbeitung komplexer in die steueroasen, unbekannte öffentlich.

"Die grundlegende lehre des projektes ist es, die geduld und ausdauer. (…) Aber die geduld wird belohnt, wenn diese daten enthüllt einen neuen horizont auf die steueroasen", folgert der ICIJ.

>> Alle unsere artikel auf "Offshore-Leaks"


Leave a Reply