Cómo un investigador robótico busca en 60 millones de archivos

Yousr Khalil formó parte de un equipo de 70 investigadores
  •  
  •  
  •  
  •  
  •  

Imagine tener que buscar todos los documentos, correos electrónicos y mensajes de una gran empresa multinacional.

Yousr Khalil no necesita imaginarlo.

Los contadores forenses son parte de un equipo que tuvo que encontrar evidencia de mala conducta en el gigante aeroespacial Airbus después de admitir que había sobornado a través de un intermediario.

“Airbus es como una torre con 900 apartamentos. Dijo:“ Tenemos que decidir en qué proyectos entrar e investigar. «

La Sra. Khalil trabaja en FRA, una empresa de investigación forense que apoya casos legales en todo el mundo.

Pero este es otro caso y el trabajo más importante en la historia de FRA.

Para calificar para el Acuerdo de enjuiciamiento diferido (DPA), Airbus llevó a cabo una revisión rigurosa de sus operaciones en 2016.

El proyecto de cuatro años para erradicar la corrupción ayudó a Airbus a llegar a un acuerdo con los reguladores del Reino Unido, Estados Unidos y Francia. Según el acuerdo, Airbus pagó 3.600 millones de euros (3.000 millones de libras) en multas en reconocimiento a sus acciones. Fraude y soborno.

Airbus tenía 60 millones de documentos y transacciones que debían analizarse

La Sra. Khalil y un equipo de 70 personas se enfrentan a documentos, datos de transacciones y correos electrónicos que involucran actividades en todo el mundo, la mayoría de las cuales son completamente inofensivas.

Entonces, ¿cómo planearon el camino?

La inteligencia artificial (IA) y las computadoras personalizadas, a diferencia de cualquier PC que haya usado, han jugado un papel importante en este épico rastreo a datos.

Debe reducirse la abrumadora colección de 500 millones de documentos y transacciones.

A medida que la cantidad de datos aumenta exponencialmente, la IA se utiliza cada vez con más frecuencia en este tipo de investigaciones.

Después de eliminar el contenido duplicado y otros materiales irrelevantes, los investigadores obtuvieron 60 millones de documentos para su revisión. AI buscó sus patrones y encontró algunos patrones inapropiados, como un acuerdo de patrocinio deportivo de $100 millones.

¿Cuál fue la relación con los empleados de Airbus durante todo esto? La Sra. Khalil dijo: «Ninguna empresa está realmente preparada para una investigación forense exhaustiva«. Pero sus colegas de Airbus están muy contentos de aceptarla. «Cuando el regulador exigió una respuesta rápida a algo, se movieron«.

Como si 60 millones de artículos no fueran suficientes para plantear un desafío, 800 empleados de Airbus en todo el mundo han sido legalmente designados como custodios de estos documentos.

Greg Mason, socio fundador y codirector de análisis de datos en FRA, dijo: «Es posible que tenga información distribuida en diferentes elementos de medios, como computadoras portátiles, dispositivos de almacenamiento, unidades USB, etc. Tuvimos que identificar quién era el custodio de esos datos«.

La investigación se complicó por proyectos militares sensibles de Airbus

Se establecieron siete sitios de investigación seguros. Estos permitieron examinar los documentos con total seguridad, un punto crucial para Airbus. Es un gran negocio enredado con importantes proyectos de aviones militares europeos. Así que la investigación tuvo que idear una manera de mantener fuera de escena el material que era sensible a nivel nacional.

El software especializado permitió la recopilación de información sin ver todo el documento del que provenía, preservando así la información secreta de defensa de miradas indiscretas.

Utilizando el principio del aprendizaje automático, mediante el cual el software de inteligencia artificial ve múltiples ejemplos de un tipo particular de mensaje y comienza a detectar a qué categoría pertenecen, FRA pudo extraer documentos relevantes a un ritmo. «El programa de IA buscó el contexto de los mensajes, el contexto lo es todo», observa Mason.

El software buscaba sobornos que se arreglaban mediante códigos, como un médico que receta un medicamento. Al ejecutar ejemplos de este tipo de mensaje oculto, el software adquirió el concepto de medicina y luego el concepto de prescripción. Esto significaba que podía atravesar datos no estructurados y detectar prácticas corruptas.

«A medida que identifica más y más ejemplos de pago encubierto, la IA aprende sobre la marcha. Esa es la belleza y la magia de la IA», dice Mason. Se estableció un sistema de puntuación, con puntos agregados para ciertos atributos. Cualquier puntaje por encima de un cierto número se consideró digno de una mayor investigación. La tecnología de aprendizaje automático se volvió cada vez mejor a medida que avanzaba.


  •  
  •  
  •  
  •  
  •  
Sobre Gustavo Zimbrón 178 artículos
Apasionado por la programación y la tecnología, me gustan los retos y aprender siempre cosas nuevas.
Subscribe
Notify of
guest
0 Comentarios
Inline Feedbacks
View all comments