the-bridge-logo.svg
6358ec8e48b5bc35efad0dc6_github-actions.png
10/11/2022  - Data Science

Aprende a usar Github Actions para Data Science

Antes de decirte cómo aprender a usar GitHub Actions es importante que sepas qué es. Así que vamos a empezar por el principio y vamos a contarte que esta herramienta te servirá para reducir la cadena de acciones imprescindible para la ejecución de código, a través de la creación de un flujo de trabajo encargado del Pipeline. Una de sus grandes ventajas es que podrás configurarla para que GitHub responda a ciertos eventos automáticamente y según tus preferencias.En pocas palabras, GitHub Actions da la opción de crear workflows que te servirán para compilar, testear y desplegar código. También ofrece la posibilidad de crear flujos de integración y despliegue continuo dentro de tu repositorio.GitHub Actions usa paquetes de códigos en los contenedores de Docker, que se ejecutan en los servidores de GitHub y que resultan compatibles con cualquier lenguaje de programación. Esto supone una gran ventaja porque de este modo, podrán usarse en servidores locales y nubes públicas.Con Github Actions la integración con Github, la herramienta más utilizada por los data scientist, es inmejorable y cuenta con dos grandes grupos según el tipo de repositorio:
  • Repositorios públicos: gratuito.
  • Repositorios privados: el precio varía en función del almacenamiento y los tiempos de ejecución del repositorio.
Conceptos básicos que debes conocer sobre GitHub ActionsAntes de contarte las bondades y la forma en la que funciona GitHub Actions, es importante que sepas las partes o acciones de las que se compone.PasoSe trata de un conjunto de tareas que te servirán para ejecutar un trabajo (comandos o acciones).TrabajoEn este caso, hacemos referencia al conjunto de pasos que se ejecutan en runner de tu proceso. Se pueden realizar de manera independiente o secuencial en función de si el éxito del trabajo depende del que se ha hecho previamente.Flujo de trabajoSe trata de un proceso automatizado que está integrado por uno o varios trabajos que se agregan a un repositorio para ser activado por un evento. Su definición se realiza por archivos YAML y mediante este flujo puedes hacer: build, test, package, etc. de un proyecto.EventoHablamos de las actividades determinadas que originan la ejecución de un flujo de trabajo.AccionesSe trata del bloque de construcción más pequeño de un flujo de trabajo. Pueden combinarse como pasos para poner en marcha un trabajo.RunnerEs una máquina que tiene instalado GitHub Actions y que espera a que los trabajos estén disponibles para realizar las acciones e informar del progreso y los resultados.Aunque en un principio Github Actions fue creada para realizar automatizaciones dentro de Github, también te da la opción de hacerlo a través de la extracción de datos o reentrenamiento de modelos sin tener en cuenta el lenguaje en el que trabajes.Ventajas de GitHub ActionsUna de las grandes ventajas de GitHub Actions es la flexibilidad que te ofrece, con un sinfín de posibilidades para que los desarrolladores dejen volar su creatividad. Pero GitHub Actions tiene más ventajas:Desarrollar en GitHubComo decíamos antes, Actions está completamente integrada en GitHub, así que no es necesario acudir a un site externo. De esta manera podrás administrarlo todo en el mismo lugar en el que tengas las funciones relacionadas con el repositorio.Multitud de plantillas de CICuenta con una gran variedad de plantillas para todo tipo de configuraciones de CI (Integración continua), lo que facilita enormemente el inicio del trabajo. Además, te ofrece la opción de crear las tuyas para publicarlas en GitHub Marketplace.Pruebas de contenedores múltiplesActions te permite ensayar configuraciones de varios contenedores cuando le hayas añadido compatibilidad para Docker y archivos de composición a tu flujo de trabajo.Interesante plan gratuitoA diferencia de otras herramientas que están muy limitadas en su versión gratuita, Github Actions es gratis para todos los repositorios de código abierto y además incluye 2000 minutos al mes de compilación a coste cero para los repositorios privados. Aún así, si esto no te sirve y necesitas ampliar las funcionalidades, puedes cambiar de plan de forma simple.Cómo usar Github Actions para Data ScienceSi después de todo lo que te hemos explicado en este artículo, no te queda demasiado claro cómo usar Github Actions para Data Science, hemos preparado un listado que te aclarará un poco más las cosas.
  • Automatizar procesos ETL simples. Por ejemplo, te servirá para la extracción de datos de una API en tiempo real que no guarda histórico. Además, puedes efectuar automatizaciones para crear dashboards que le resulten de interés a la comunidad.
  • Producción de algoritmos mediante MLOps. Se puede automatizar el reentrenamiento de los modelos sin demasiados quebraderos de cabeza.
  • Elaboración de sistemas de alertas a herramientas como Slack.
  • Testeo de código o de comparación de modelos.
  • Automatización del build y el push de imágenes de Docker.
Estas son solo algunas de las acciones y procedimientos que puedes realizar con Github Actions, pero si quieres convertirte en un auténtico experto en una de las herramientas más utilizadas por los data scientist, el bootcamp de Data Science en The Bridge, es el paso definitivo para conseguirlo. ¿Necesitas más información? ¡Pregúntanos!
Sigue leyendo. Artículos especializados en diferentes áreasEcha un vistazo al resto de artículos que tenemos en nuestro blog. Trabajamos duro para crear contenido de calidad y enriquecer la comunidad.
    ¿Te has quedado con ganas de saber más?No lo dudes y contacta con nosotros, te resolveremos todas las dudas y te asesoraremos para que encuentres el bootcamp, la modalidad y el plan de financiación que mejor se adapta a ti.
    SOLICITA INFORMACIÓN