Más allá del machine learning, deep learning por Alberto Ruíz Rodas en TomatinaCON.

Más allá del Machine learning: Deep learning para detectar webs maliciosas

Hablar de inteligencia artificial (IA) parece que se ha convertido en el mantra de moda y que todo el mundo lo aplica a su actividad cual coletilla que suma puntos pero la realidad es que no es tan novedoso como se pueda pensar y hay tantos especialistas que dominen este campo de manera profunda pero sin embargo su aplicación práctica sí está al alcance de muchos.

La IA lleva años desarrollándose y no hay que esperar a un futuro lejano para ver su utilidad pues ya a día de hoy está más presente de lo que creemos en multitud de tecnologías: asistentes de voz, vehículos de conducción autónoma, sistemas de reconocimiento facial…

A pesar de lo presente que está, seguimos desconociendo su funcionamiento básico por eso cuando salen a flote términos como machine learning o deep learning parece que se han inventado antesdeayer y no es así. La diferencia es que ahora que vivimos en plena generación y explosión de datos y gracias al big data se pueden crear más cosas y más certeras y completas al tener mayor número de datos con el que entrenar el aprendizaje automático de las máquinas.

En las pasadas Jornadas de Seguridad Informática TomatinaCON Alberto Ruíz Rodas dio una charla divulgativa, disponible a continuación tanto en vídeo como en podcast, en la que explicó de manera muy sencilla en qué consiste el machine learning, el deep learning y los sistemas de entrenamiento de las redes neuronales y explicó los pasos para poder crear un sistema basado en Deep learning para poder detectar webs maliciosas.

Para entender bien toda esta terminología recomiendo complementar esta charla con la ponencia de Rubén Martínez ‘Introducción a las redes neuronales convolucionales: Deep learning aplicado a robótica‘ y la charla ‘Aprendizaje automático en la detección de actividad criminal‘ que están disponibles en el canal.

Alberto Ruiz Rodas(@AlbertoRRodas) es ingeniero de Telecomunicaciones y trabaja como ingeniero preventa de Sophos para España y Portugal. Está especializado en diseño y administración de redes y sistemas, soluciones de seguridad perimetral y soporte técnico y cuenta con más de 12 años de experiencia trabajando en el sector de seguridad TI.

En Palabra de hacker hay disponibles otras charlas de Alberto tales como ‘Prevención de ataques de ingeniería social‘ y ‘La curiosa historia del spam y cómo protegerse del phishing‘ así como el ciberdebate ‘Fraudes online. Cómo identificarlos y evitarlos‘ en el que participó.

Manos a la obra: crea un sistema basado en Deep Learning para detectar URLs maliciosas

Si estás dispuesto a jugar creando un sistema que te permita identificar páginas web que son malas seguir los pasos que propone Alberto en la charla es muy sencillo. Yo voy a dejar por aquí los enlaces que comenta para que puedas tener acceso a todo y cacharrear con el deep learning entrenando y alimentando tu propia red para poder identificar url maliciosas.

Los compañeros de Alberto del departamento de Data Science (Ciencia de datos) de Sophos han elaborado un repositorio con una base de datos de más de un millón de páginas web buenas y más de 62.000 webs maliciosas que sin duda es un gran punto de partida para poder elaborar un sistema propio de identificación.

El repositorio está disponible en GitHub desde este enlace http://github.com/inv-ds-research/ en el repositorio SophosMachineLearningBuildingBlocksTutorial que es el que contiene el Data Set con los dos listados de URLs en formato CSV (Clean.CSV y Dirty.CSV) que se pueden descargar.

Para sacarle partido a este repositorio hay tres opciones en función de los conocimientos que se tengan: usar Tensorflow, usar Keras que resulta más sencillo o usar Python si se domina este lenguaje y que abre muchas más posibilidades.

Si te ha gustado puedes dejarme abajo un comentario y compartir la entrada, el vídeo o el podcast para que otros también puedan disfrutarlo. ¡Gracias!

Vídeo

Podcast

¿Tienes Telegram? Suscríbete al canal de Palabra de hacker: https://t.me/palabradehacker

    ¿Quieres recibir todas las novedades por newsletter?

    Nombre

    Correo electrónico


    Información básica sobre Protección de datos. Responsable del tratamiento de datos: Yolanda Corral. Finalidad: Gestionar las suscripciones a la web para estar informados de nuevas publicaciones y novedades. Legitimación: Contar con el consentimiento expreso del interesado. Destinatarios: Yolanda Corral como encargada del tratamiento de datos, adoptando las necesarias medidas de seguridad y confidencialidad. Los datos que me facilites estarán ubicados en los servidores de Raiola Networks, ubicados en la UE cuyo nivel de protección son adecuados según la Comisión de la UE. Derechos: Tienes derecho de información, a acceder, rectificar, limitar y cancelar tus datos tal y como puedes ver detalladamente en la política de privacidad de esta web así como en el aviso legal.

    AVISO LEGAL - PRIVACIDAD - COOKIES

    { «@context»: «https://schema.org», «@type»: «VideoObject», «name»: «Más allá del Machine learning: Deep learning para detectar webs maliciosas», «@id»: «https://www.yolandacorral.com/machine-learning-deep-learning-detectar-webs/#videoobject», «datePublished»: «2019-04-20», «description»: «Aplicando inteligencia artificial en pro de la seguridad. Cómo crear un sistema basado en Deep learning para detectar webs maliciosas, una charla de Alberto Ruíz Rodas en TomatinaCON.», «thumbnailUrl»: «https://www.yolandacorral.com/wp-content/uploads/Machine-learning-Deep-learning-detectar-webs-maliciosas-Palabra-de-hacker-1.jpg», «uploadDate»: «2019-04-20», «duration»: «PT31M12S», «publisher»: { «@type»: «Organization», «name»: «Palabra de hacker by Yolanda Corral», «logo»: { «@type»: «ImageObject», «url»: «https://www.yolandacorral.com/wp-content/uploads/Logo-Palabra-de-hacker-ciberseguridad-de-tu-a-tu.png», «width»: 60, «height»: 60 } }, «embedUrl»: «https://youtu.be/wdG3NDd5fY0» }

    ¡Deja tu comentario! Tu correo electrónico no será publicado.

    Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.