¿A qué nos estamos refiriendo cuando hablamos de big data y data mining? Cuando nos referimos a big data, también conocido como macrodatos o datos a gran escala, estamos hablando de almacenamiento de grandes cantidades de datos y a los procedimientos usados para encontrar patrones repetitivos de esos datos. Se trata en definitiva, de una tecnología capaz de capturar, gestionar y procesar de manera eficiente una gran cantidad de datos[1]. Por otra parte el data mining, también conocido como minería de datos, consiste en el conjunto de técnicas que se realizan para explorar grandes cantidades de datos (big data). A través de esta técnica se busca descubrir patrones y tendencias, estructurando la información que se ha obtenido de una manera comprensible para su utilización. El data mining reúne las virtudes de diferentes campos tales como: la inteligencia artificial, la estadística, las bases de datos, la computación gráfica y el procesamiento masivo, especialmente usando como materia prima las bases de datos[2].
Se trata por lo tanto de dos conceptos estrechamente vinculados pero que tienen un enfoque distinto en el tratamiento de los datos. Por un lado, el big data tiene se centra en la gestión de grandes volúmenes de datos que puedan estar disponibles por la organización que los genera, y de otra el data mining se centra en el análisis de los datos por lo que resulta imprescindible si se pretende dar valor al big data se requiere emplear las herramientas analíticas que ofrece el data mining.
Pero nos podemos preguntar ¿en el ámbito policial puede resultar útil el empleo de estas técnicas? y la respuesta la podemos encontrar en un estudio realizado por Alexander Babuta en el año 2017, autor del informe “Macrodatos y trabajo policial. Una valoración de las necesidades, expectativas y prioridades de los cuerpos de seguridad” [3] y que comentamos por resultar de gran interés aunque este estudio no sea muy reciente y que puede interesar a los especialistas en seguridad pública:
La investigación criminal ha identificado una serie de limitaciones fundamentales en el uso actual de los datos por parte de la policía dada la fragmentación de las bases de datos y las aplicaciones de software lo que ha mermado la eficiencia de las fuerzas policiales, ya que los datos policiales se gestionan a través de múltiples sistemas separados que no son mutuamente compatibles. Además, en la mayoría de los casos, el análisis de datos digitales es casi completamente manual, a pesar de que hay software disponible para automatizar gran parte de este proceso, habitualmente no tienen acceso a herramientas analíticas avanzadas para rastrear y analizar datos no estructurados, como imágenes y vídeos, y por esta razón no pueden aprovechar plenamente las amplias capacidades de vigilancia.
Según este informe, entre las numerosas formas en que la tecnología de big data podría aplicarse a la policía del Reino Unido, cuatro se identifican como prioridades clave.
- En primer lugar creando mapas de predicción delictiva de delincuencia para destinar las patrullas allí donde hay mayor probabilidad de que sucedan los delitos lo que permitiría que los recursos limitados se dirijan de manera más eficiente.
- En segundo lugar, la analítica predictiva también podría utilizarse para identificar los riesgos asociados con determinadas personas para identificar a los delincuentes reincidentes así como sus potenciales víctimas.
- En tercer lugar, la analítica avanzada podría permitir a la policía aprovechar todo el potencial de los datos recopilados a través de la vigilancia visual, como las imágenes de CCTV y los datos de reconocimiento automático de matrículas (ANPR automatic number plate recognition).
- En cuarto lugar, la tecnología de big data podría aplicarse a datos de código abierto, como los recopilados de las redes sociales, para obtener una comprensión más rica de los problemas específicos de la delincuencia, lo que en última instancia informaría el desarrollo de estrategias policiales
Se ha demostrado una y otra vez que la creación de mapas predictivos de puntos críticos o negros es significativamente más efectiva en la predicción de la ubicación de futuros delitos que las técnicas basadas en inteligencia criminal. Sin embargo, pocos esfuerzos se han desplegado en la práctica en las estrategias actuales de patrullaje. La policía recopila una gran cantidad de datos históricos sobre delitos que podrían utilizarse para predecir dónde es probable que ocurran los delitos, lo que permitiría aplicar mejor los recursos limitados al dirigirse directamente donde más se necesitan. Este análisis predictivo hace posible que la policía utilice el historial de delitos detectados para identificar a las personas que corren un mayor riesgo de reincidencia, así como el uso de datos de agencias asociadas para identificar a las personas que son particularmente vulnerables y necesitan protección.
Se afirma en este informe que las herramientas analíticas que predicen los riesgos asociados deben utilizar conjuntos de datos nacionales. Es decir, habitualmente el análisis de este tipo se lleva a cabo actualmente utilizando conjuntos de datos de la policía local, pero el uso de conjuntos de datos nacionales es necesario para obtener una comprensión completa de estos riesgos de ámbito nacional más que local.
Se necesita, además, desarrollar más investigación en la explotación de los usos potenciales de la modelización de espacio de riesgo (RTM, Risk Terrain Modelling) para identificar las áreas con mayor riesgo delictivo. Los métodos actuales de mapas predictivos se basan únicamente en eventos delictivos pasados para predecir delitos futuros, y son indiferentes a los factores geográficos y ambientales subyacentes que hacen que ciertos lugares sean más vulnerables a la delincuencia. RTM tiene en cuenta estos factores ambientales subyacentes para proporcionar un análisis exhaustivo del riesgo espacial, y algunos estudios han demostrado que RTM tiene un mejor poder predictivo que el mapeo retrospectivo de hotspot (de puntos calientes)
Se necesita, además, continuar con investigaciones adicionales para explorar el uso de matrices de daños para evaluar los daños causados por diferentes tipos de delitos. En la actualidad, en la mayoría de las fuerzas policiales, la priorización de sus recursos se basan principalmente en el estudio sobre el volumen total de delitos en un área determinada, en oposición a los daños causados por diferentes tipos de delitos. Herramientas como la Matriz MoRiLE (riesgos en la aplicación de la ley) demuestran que es posible utilizar los datos para comprender el daño de una manera mucho más profunda, teniendo en cuenta factores como los daños causados a las personas, las comunidades y la economía. Se necesita explorar estos potenciales con mayor detalle y desarrollar métodos analíticos más sofisticados para evaluar el daño causado por diferentes tipos de delitos.
[1] BALAGUERÓ, T. (2017): Deusto Formación.
[2] Ibídem
[3] ROYAL UNITED SERVICES INSTITUT https://www.rusi.org/