domingo, 9 de noviembre de 2008

IDENTIFICACIÓN Y DETECCION DE PATRONES DELICTIVOS BASADA EN MINERIA DE DATOS

Suele denominarse “criminalistica” a la disciplina que tiene como finalidad el descubrimiento de los delitos. En la practica policial o judicial no es suficiente saber que un hecho punible ha tenido ejecución, sino que se necesita averiguar como, cuando, donde y quien lo realizó y afectos de poder imponerle la adecuada sanción penal. En la técnica moderna la criminalistica se vale de diversas ciencias y artes, tales como la física, la química, medicina legal, o la antropometría, la fotografía, la dactiloscopia, la balística ; ad infinitum ; que permiten en cada caso determinar el valor probatorio de los rastros e indicios, que han sido advertidos.



A partir de la crisis de finales de 2003, Chile se vio afectada por una creciente ola de inseguridad caracterizada por un aumento en los índices delictivos y los niveles de violencia. Esta situación fue más profunda en los principales centros urbanos y llevó a tomar acciones coordinadas a nivel nacional tendientes a prevenir el delito. En el plano internacional, los ataques terroristas del 11 de septiembre han aumentado significativamente la preocupación por la seguridad interna en EEUU. Las agencias de inteligencia como la CIA o el FBI procesan y analizan información activamente en busca de actividad terrorista [Chen et al, 2004]. El análisis de los registros criminales es fundamental en la prevención del delito. Entre otras cosas, porque permite el diseño de políticas y planes de prevención efectivos. En Chile este tipo de análisis se ha realizado históricamente mediante herramientas estadísticas descriptivas o deductivas, considerando fundamentalmente variables y relaciones primarias. Sin embargo, muchas veces la estadística descriptiva clásica no refleja la verdadera interrelación de las variables y por lo tanto, el problema real. Este contexto requiere un tratamiento estadístico más complejo que nos obliga a evolucionar en el análisis de información criminal. En general, el tamaño de las bases de datos está basado en aspectos como la capacidad y eficiencia de almacenamiento y no en su posterior uso o análisis [Kantardzic, 2002]. Por esta razón, en muchos casos, los registros almacenados son demasiado grandes o complejos como para analizar [Kantardzic, 2002] y superan el alcance de la estadística [Hand, 1997]. La Minería de Datos (Data Mining) es un proceso iterativo de búsqueda de información no trivial en grandes volúmenes de datos [Kantardzic, 2002]. Busca generar información similar a la que podría generar un experto humano: patrones, asociaciones, cambios, anomalías y estructuras significativas [Ochoa, 2004]. En el caso de la inteligencia criminal, la gran cantidad de información y de variables intervienientes justifican el uso de herramientas más potentes que la estadística convencional que permitan determinar relaciones multivariantes subyacentes. La minería de datos aplicada a la inteligencia criminal es un campo bastante nuevo y ha tenido un gran impulso en los últimos años en EEUU [Chen et al, 2003].

Aplicaciones Informáticas en el Análisis de la Información Criminal

En los últimos tiempos la cantidad de información criminal recogida ha experimentado un crecimiento exponencial. Por ejemplo, a partir de los ataques terroristas del 11 de septiembre las agencias de inteligencia de EEUU, como la CIA o el FBI, procesan y analizan información activamente en búsqueda de actividad terrorista [Chen et al., 2004]. Este hecho provoca que los analistas encuentren cada vez más dificultad para reunir la información adecuada, en un momento determinado, para la toma de decisiones (la llamada “paradoja de la información”; hay más información pero menos conocimiento).

A su vez las modalidades criminales son cada vez más complejas y dinámicas. Bajo esta perspectiva se hace indispensable la utilización de herramientas informáticas para el tratamiento y análisis de la información criminal.

En tal sentido, el aporte de la informática en este campo abarca un amplio espectro que va desde la simple visualización de los hechos en un mapa hasta el uso de técnicas complejas de minería de datos. Los países que más han contribuido al desarrollo de estas aplicaciones son Estados Unidos y Reino Unido. A continuación se describen las principales técnicas y proyectos realizados a nivel mundial.


Las Fuentes de Información Criminal

Entendemos por información criminal a toda aquella información resultante a partir de un presunto delito o de sus componentes (victima, victimario, propiedades, vehículos, etc.) que sea relevante para la toma de decisiones a posteriori. Ya sea en la prevención, detección y esclarecimiento del delito como en la prosecución de delincuentes, la mejora de procesos judiciales y la creación de nuevas leyes.

Según esta definición la mayor fuente de información criminal es el Sistema Penal, entendido como el conjunto de instituciones y procedimientos presentes en el proceso que transita un hecho delictuoso desde que es registrado por el Estado.



Podemos subdividir al Sistema Penal según las distintas instancias en Sistema Policial dependiendo del Pais de origen, por ejemplo en Argentina se tiene el Sistema Judicial y Sistema Penitenciario. Como muestra la siguiente Figura, una gran cantidad de hechos ingresa por el Sistema Policial, atraviesa el cuello de botella del Sistema Judicial y egresa a través del Sistema Penitenciario.


Técnicas geográfico-visuales: el Mapa del Delito

El mapa del delito consiste en geo-referenciar los hechos delictivos, obteniendo una visualización geográfica que contempla no sólo la distancia entre hechos, sino también el equipamiento urbano (bancos, comercios, plazas, etc.) y las demarcaciones territoriales (comisarías, barrios, zonas marginales, etc.).

Para la realización del mapa del delito se utilizan sistemas informáticos que permiten integrar, almacenar, analizar y visualizar información geográfica. Estos sistemas se denominan GISs (Geographic Information Systems) y los más utilizados a nivel mundial son MapInfo [Mapinfo, 2007] y Arcview [ESRI, 2007].


Las Fuentes de Información Criminal

Entendemos por información criminal a toda aquella información resultante a partir de un presunto delito o de sus componentes (victima, victimario, propiedades, vehículos, etc.) que sea relevante para la toma de decisiones a posteriori. Ya sea en la prevención, detección y esclarecimiento del delito como en la prosecución de delincuentes, la mejora de procesos judiciales y la creación de nuevas leyes.


Según esta definición la mayor fuente de información criminal es el Sistema Penal, entendido como el conjunto de instituciones y procedimientos presentes en el proceso que transita un hecho delictuoso desde que es registrado por el Estado.

Podemos subdividir al Sistema Penal según las distintas instancias en Sistema Policial, Sistema Judicial y Sistema Penitenciario. Es recomendable que el sistema de gobierno aplique este esquema con opción de replica en cada una de las provincias del territorio nacional.

Este sistema de gobierno tiene fuertes implicancias en la consolidación de la información a nivel nacional. No sólo por la falta de homogeneidad entre las distintas provincias, sino fundamentalmente porque cada provincia tiene autonomía sobre la información generada bajo su jurisdicción y el Estado Nacional no tiene injerencia sobre la misma.


Técnicas Informáticas Utilizadas en el Análisis de Información Criminal


Existen muchas técnicas de análisis y visualización que trabajan sobre GISs. La mayoría de ellas buscan determinar y delimitar zonas de alta densidad delictiva, comúnmente llamadas “zonas calientes” o hotspots. Entre estas técnicas podemos mencionar [Eck, 2005]:

* Elipses de desvío estándar (standard deviation ellipses): utilizados para delimitar agrupaciones de hechos identificadas mediante técnicas de clustering.

* Mapas coloreados (chloropeth maps): en donde la escala de color representa la cantidad de hechos registrados en una determinada jurisdicción geográfica.

* Mapas de grillas (quadrat maps): similar al anterior, pero en este caso el mapa se fracciona según una grilla y la escala de color representa la cantidad de hechos registrados en cada celda, asegurando igualdad de superficie.

* Mapas de contorno suavizado (kernel density estimation): similar al anterior pero con un efecto continuo logrado mediante el uso de algoritmos. Este último es el más apropiado de todos los métodos para la visualización del delito.

Existen varios paquetes de análisis estadístico espacial para información criminal que trabajan sobre GISs. Uno de los primeros fue STAC (Spatial and Temporal Análisis of Crime), desarrollado por la Autoridad para la Información de Justicia Criminal de Illinois [ICJIA, 2007]. Luego le siguieron CompStat y CrimeStat [CrimeStat, 2007].

Este último contiene un amplio set de algoritmos y si bien sus resultados pueden ser visualizados en GIS, esta orientado hacia un usuario con determinados conocimientos técnicos. Por esta razón su uso queda limitado al analista criminal más que al policía tradicional [Oatley et al., 2004].

Es importante aclarar que si bien todo este software encuentra su mayor utilización en el campo de la información criminal, la mayoría puede ser utilizado en cualquier otro campo en que se trate de información espacial, ya que en general no incorpora ningún conocimiento específico del dominio criminal.