Paloma Recuero de los Santos Data Science: ¿Cómo hacer las preguntas adecuadas? Cuando hablamos de Ciencia de Datos, o de Aprendizaje Automático, solemos hablar de datos, algoritmos, modelos, etc. Y no nos damos cuenta de que, quizás, hemos pasado”de puntillas” por...
Antonio Pita Lozano ¡Que la fuerza te acompañe LEIA! Son tiempos difíciles para la galaxia, la crisis financiera acecha a la unión y los estados periféricos imponen aranceles en su luchan con el control comercial. De forma silenciosa,...
Fran Ramírez Cómo entrenar a tu Inteligencia Artificial jugando a videojuegos. Parte 3, resolviendo CartPole con Random Search Escrito por Fran Ramírez, Investigador en Eleven Paths y escritor del libro “Microhistorias: anecdotas y curiosidades de la historia de la informática”. Ahora que ya conocemos perfectamente el entorno en el cual funciona Cartpole, vamos...
LUCA Debate: ¿Y hacia dónde se dirigirá el CDO 3.0? Tal y como se señaló en anteriores reuniones del Club, la comunidad se ha convertido en una voz de referencia: la de los CDO. Por ello, el debate ocupó una vez...
LUCA Caso de éxito: Optimizando el plan de carreteras de Highways England La industria del transporte es una industria muy permeable a la aplicación de estrategias de Big Data e Inteligencia Artificial, ya que existen casos de uso claros para maximizar...
LUCA Incorporación de Big Data en el sector público: caso de éxito Navantia ¿Cuáles son los ingredientes principales para una transformación digital exitosa? La transformación digital se ha hecho indispensable en casi todos los sectores, también en la administración pública y, como hoy vamos...
LUCA Diseñando el mapa de publicidad OOH en Brasil gracias a los datos Es imprescindible que una empresa maximice el alcance de sus clientes, y una manera de conseguirlo es hacer uso del poder y valor que ofrece la publicidad. Hoy en...
LUCA Lo que se mueve en tu país vecino, y más allá El valor de las llamadas telefónicas internacionales para entender nuestra sociedad Telefónica dispone de una amplia infraestructura global de red que es ofrecida a otras operadoras para transportar su tráfico...
LUCA LUCA Talk: Prediciendo las emergencias del 112 con Inteligencia Artificial Creemos en las infinitas posibilidades que ofrece la tecnología para el bien social, y es por eso que dedicamos nuestro primer webinar del año 2019 a la predicción de...
LUCA LUCA Talk: Usos de GANs y Autoencoders en Ciberseguridad En esta era de transformación digital de la sociedad y las organizaciones, los avances tecnológicos han supuesto un cambio en la forma de vivir y relacionarse de los seres...
LUCA LUCA Talk: La transformación empieza por la formación La transformación digital de las empresas empieza por el cambio cultural de las personas y no en la tecnología. De nada sirve apostar por tecnología más puntera como Machine...
Paloma Recuero de los Santos Video Post #14: “ScyPy, NumPy, Pandas…¿Qué librerías Python necesito? En esta nueva edición de LUCA video post, damos un paso más en nuestro aprendizaje de Python aprendiendo lo que son los módulos, y, en particular las...
Atrévete con Python: un experimento para todos los públicosPaloma Recuero de los Santos 13 marzo, 2018 Al igual que hicimos en nuestro experimento sobre el dataset del Titanic en Azure Machine Learning Studio, vamos a seguir con la estrategia del “Learning by doing” porque consideramos que la mejor forma de aprender es llevar a cabo pequeños proyectos, de principio a fin. Un proyecto de Machine Learning puede no ser lineal, pero tiene una serie de etapas bien definidas: 1. Definir el problema 2. Preparar los datos 3. Evaluar distintos algoritmos 4. Refinar los resultados 5. Presentarlos Por otro lado, la mejor manera de conocer una nueva plataforma o herramienta es trabajar con ella. Y eso es precisamente lo que vamos a hacer en este tutorial: conocer Python como lenguaje, y como plataforma. ¿Qué NO hace falta para poder seguir este tutorial? El objetivo de este post es mostrar cómo se puede hacer un experimento sencillo de Machine Learning en Python. Personas muy distintas, con perfiles diferentes pueden trabajar con modelos de ML. Por ejemplo, un investigador de Ciencias Sociales, o un experto en Finanzas, Seguros, Marketing etc. lo que quieren es aplicar el modelo (y ¿por qué no?, comprender cómo funciona). O un desarrollador que ya conoce otros lenguajes/entornos de programación, puede querer empezar a aprender Phyton. O un Data Scientist que trabaja desarrollando nuevos algoritmos en R, por ejemplo, y quiere empezar a trabajar en Python. Así, en vez de hacer un listado de los requisitos previos para poder seguir el tutorial, vamos a detallar lo que no hace falta: No hace falta comprenderlo todo a la primera. El objetivo es seguir el ejemplo de principio a fin y obtener un resultado real. Puedes ir tomando nota de las preguntas que te van surgiendo, y usar la función help (“FunctionName”) de Python para aprender sobre las funciones que vamos usando.No hace falta saber exactamente cómo funcionan los algoritmos. Es conveniente conocer sus limitaciones, y cómo se configurarlos. Pero se puede aprender poco a poco. El objetivo de este experimento es perderle el miedo a la plataforma y ¡seguir aprendiendo con otros experimentos!No hace falta ser programador. El lenguaje Python tiene una sintaxis bastante intuitiva. Como pista para empezar a comprenderlo, conviene fijarse en las llamadas a funciones (e.g. function()) y en la asignación de variables (e.g. a = “b”). Lo importante ahora es “arrancar”, poco a poco, se pueden ir aprendiendo todos los detalles (si es nuestro interés).No hace falta ser un experto en Machine Learning. Puedes ir aprendiendo poco a poco sobre las ventajas y limitaciones de los distintos algoritmos, sobre cómo mejorar en las distintas etapas del proceso, o la importancia de evaluar la precisión mediante la validación cruzada. Como es nuestro primer proyecto en Python, vamos a centrarnos en los pasos básicos. En otros tutoriales podremos trabajar sobre otras tareas como la preparación de datos con Panda o la mejora de los resultados con PyBrain. ¿Qué es Python? Python es un lenguaje de programación interpretado, orientado a objetos de alto nivel y con semántica dinámica. Su sintaxis hace énfasis en la legibilidad del código, lo que facilita su depuración y, por tanto, favorece la productividad. Ofrece la potencia y la flexibilidad de los lenguajes compilados con una curva de aprendizaje suave. Aunque Python fue creado como lenguaje de programación de uso general, cuenta con una serie de librerías y entornos de desarrollo para cada una de las fases del proceso de Data Science. Esto, sumado a su potencia, su carácter open source y su facilidad de aprendizaje le ha llevado a tomar la delantera a otros lenguajes propios de la analítica de datos por medio de Machine Learning como pueden ser SAS (software comercial líder hasta el momento) y R (también open source, pero más propio de entornos académicos o de investigación). Python fue creado por Guido Van Rossum en 1991 y, como curiosidad, debe su nombre a la gran afición de su creador por las películas del grupo Monty Python. Además de librerías de herramientas científicas, numéricas, de herramientas de análisis y estructuras de datos, o de algoritmos de Machine Learning como NumPy, SciPy,Matplotlib, Pandas o PyBrain, de las que hablaremos con más detalle en otro de los post del tutorial, Python ofrece entornos interactivos de programación orientados al Data Science. Entre ellos encontramos: 1. La Shell o intérprete de Python, que se puede lanzar desde el menú Windows, es interactiva (ejecuta las órdenes según las escribes), y resulta útil para pruebas y cálculos sencillos, pero no para el desarrollo. 2. IPython : Es una versión extendida del intérprete que permite resaltado de líneas y errores mediante colores, una sintaxis adicional para el shell, y autocompletado mediante tabulador. 3. Los IDE o Entornos de desarrollo integrado como Ninja IDE, Spyder, o, con el que vamos a trabajar, Jupyter. Jupyter es una aplicación web que permite crear y compartir documentos con código ejecutable, ecuaciones, visualización, y texto explicativo. Además de Python es compatible con más de 40 lenguajes de programación, incluyendo: R, Julia, y Scala y se integra muy bien con herramientas Big Data, como Apache Spark. ¿Qué pasos vamos a dar en este tutorial? Para que no sean demasiado largos, vamos a dividir el trabajo en distintos post. Introducción: Machine Learning con Python para todos los públicos.Python para todos (1): Instalación del entorno Anaconda.Python para todos (2): ¿Qué son los Jupiter Notebook?. Creamos nuestro primer notebook y practicamos algunos comandos fáciles.Python para todos (3): ¿Qué son las librerías?. Preparamos el entorno.Python para todos (4): Empezamos el experimento propiamente. Carga de datos, análisis exploratorio (dimensiones del dataset, estadísticas, visualización etc)Python para todos (5) Final: Creación de los modelos y estimación de su precisión ¿Preparados?. Mañana mismo empezamos…. Los post más interesantes de LUCA Data Speaks 2018 organizados por series y temáticas II Encuentro Big Data Talent Madrid 2018Python para todos (1): Instalación del entorno Anaconda
Paloma Recuero de los Santos Data Science: ¿Cómo hacer las preguntas adecuadas? Cuando hablamos de Ciencia de Datos, o de Aprendizaje Automático, solemos hablar de datos, algoritmos, modelos, etc. Y no nos damos cuenta de que, quizás, hemos pasado”de puntillas” por...
Antonio Pita Lozano ¡Que la fuerza te acompañe LEIA! Son tiempos difíciles para la galaxia, la crisis financiera acecha a la unión y los estados periféricos imponen aranceles en su luchan con el control comercial. De forma silenciosa,...
LUCA Caso de éxito: Optimizando el plan de carreteras de Highways England La industria del transporte es una industria muy permeable a la aplicación de estrategias de Big Data e Inteligencia Artificial, ya que existen casos de uso claros para maximizar...
LUCA LUCA Talk: La transformación empieza por la formación La transformación digital de las empresas empieza por el cambio cultural de las personas y no en la tecnología. De nada sirve apostar por tecnología más puntera como Machine...
Paloma Recuero de los Santos IA bajo el microscopio: meetup y entrega de Data Science Awards Spain 2019 El pasado 5 de diciembre, en el Auditorio del Espacio Fundación Telefónica, tuvo lugar el encuentro Inteligencia Artificial bajo el Microscopio, en el que se hizo...
Jesús Montoya Sánchez de Pablo Cómo transformar una compañía. Paso 2: conectar la tecnología con el negocio En una entrada anterior, presentamos la priorización de los casos de uso como el primer paso hacia la transformación de las compañías en el marco de un plan de...