CARMA, nuestro conjunto gratuito de muestras de malware de Android para investigación

Área de Innovación y Laboratorio de ElevenPaths    30 marzo, 2020

Hemos comprobado que investigadores del ámbito académico generalmente trabajaban con conjuntos de malware muy pobres, o bien que tenían problemas para obtener un buen conjunto de muestras de malware. Queremos que el campo académico pueda trabajar con mejores muestras para que sus investigaciones sean más útiles y todos obtengamos una óptima detección de malware, adware y PUP.

CARMA: a huge and free curated android malware and PUP set

¿Qué es CARMA?

ElevenPaths Curated Android Malware APK Set (CARMA) es un servicio gratuito ofrecido por el área de Innovación y Laboratorio de ElevenPaths. Proporciona un conjunto de muestras de malware, adware y otros archivos potencialmente peligrosos recopilados para el sistema operativo Android. Estas muestras tienen un uso exclusivamente destinado a la investigación o estudio académico y está prohibido su uso para cualquier otro fin, lucrativo o no. El fin de estos conjuntos es proporcionar muestras de calidad que puedan ser utilizadas para su análisis en sistemas expertos, Machine Learning, inteligencia artificial o cualquier otro método que permita mejorar la detección futura de este tipo de amenazas.

Ofrecemos un conjunto de varios gigas de muestras de malware completas en su formato original, no alteradas y clasificadas por año, origen y tipo de amenaza. Desde Google Play y otros markets, PUP, adware, malware… clasificadas por años desde 2017. ¡Y también goodware!

¿Cómo se ha hecho la clasificación?

Clasificar el malware con base en antivirus tiene ventajas, pero también inconvenientes. Si entrenas un sistema con los veredictos de un antivirus, solo podrás aprender como máximo lo que el antivirus conoce o aproximarse a unos resultados parecidos. Si, para colmo, las muestras usadas para el entrenamiento y aprendizaje están etiquetadas de forma confusa (cosa que ocurre habitualmente entre varios motores en el mundo de los antivirus) los sistemas pueden intentar aprender de elementos tan dispares como un adware o un troyano y perder eficacia.

En nuestro conjunto, hemos tomado como base algunos motores antivirus reputados, pero además hemos aplicado otras reglas que pensamos interesantes. Por ejemplo, que todos estén de acuerdo en las etiquetas a la hora de evaluar la amenaza y que no sean conjuntos superpuestos. Además, hemos tenido en cuenta otras variables, como que los markets hayan expulsado las muestras, que sean veteranas en él, o el consenso de varias tecnologías para la catalogación.

El sistema no es perfecto y nunca lo será, pero suple algunos fallos habituales que hemos encontrado. Si a esto añadimos que ofrecemos un número significativo de muestras (cosa que agradecen los analistas), podemos mitigar este fallo.

Soy una organización investigadora, ¿cómo lo consigo?

CARMA nace como una extensión de nuestro ya veterano Tacyt. Solo tienes que justificar su uso a través de este formulario. Te responderemos de forma manual. Debes firmar un pequeño documento de compromiso y entendimiento donde la única obligación es una mención mutua.

Toda la información aquí: https://tacyt.elevenpaths.com/carma

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *