Hola #TidyTuesday
By Javier Tamayo-Leiva
- 3 minutes read - 507 wordsDesde que empecé a aprender R, mi principal motivación ha sido conseguir visualizaciones increíbles como las que hacen Cédric Scherer, Georgios Karamanis, y Thomas Lin Pedersen entre muchos otros. Lo que me fascina de ellos es que para lograr ese objetivo hay que lidiar con el código, el manejo de los datos y la selección gráfica adecuada, al mismo tiempo que se revisa el diseño estético. Finalmente, todo este proceso dará sus frutos convirtiendo los datos planos en una gran pieza de visualización. Sin embargo, mientras que algunos están más capacitados y/o han sido dotados de habilidades y gusto por el diseño y la estética -si es que hay algo parecido- para mí ha sido un viaje en ambos aspectos de la visualización de datos, convirtiéndose en agradables compañeros de viaje de la ciencia de datos. Así que, para incorporar todo este aspecto diferente de los datos y la visualización en mi repertorio de habilidades debo hacer algo de práctica para aprender más sobre la ciencia detrás del proceso, así que mientras buscaba ideas, se me pasaron por la cabeza todas las fantásticas visualizaciones que he visto a lo largo de los años para las contribuciones de #TidyTuesday.
#TidyTuesday es un proyecto dirigido al ecosistema R-RStudio en el que se entrega un nuevo conjunto de datos semanalmente. El proyecto surgió como una idea colaborativa de la Comunidad de Aprendizaje Online R4DS y el libro R for Data Science y conectada a través de la comunidad #RStats, como un ejercicio para trabajar la comprensión de cómo se manipulan y se organizan los datos para hacer gráficos con herramientas del {tidyverse} como {ggplot2}, {tidyr}, {dplyr}. Sin embargo, no es exclusivo del tidyverso, ya que las únicas reglas son el respeto a los participantes y compartir el código utilizado para generar los resultados.
Así pues, a continuación os mostraré mi primera contribución al #TidyTuesday, donde investigo el salario medio de las enfermeras estadounidenses por estados y el número de enfermeras registradas por estado a lo largo del tiempo.
Contribution #TidyTuesday Week 41 - Registered Nurses in US
— Javier Tamayo-Leiva (@TamayoLeiva_J) October 10, 2021
Combined plot of annual salary and number of registered nurses in the US. by states.
[R Code] https://t.co/SVm4KCnDEw#ggplot2 #patchwork #dataviz pic.twitter.com/dIUs2fYtOR
La segunda, en la que exploré la producción mundial de mariscos sobre la sostenibilidad biológica global, y me gusta pues es la primera vez que uso los moonplots de {gggibbous}
Contribution #TidyTuesday Week 42 - Global Fishing
— Javier Tamayo-Leiva (@TamayoLeiva_J) October 15, 2021
This week we explore the impact of global seafood production on global biological sustainability.
[R Code] https://t.co/ypEtg3tJtO#ggplot2 #gggibbous #dataviz pic.twitter.com/CsB9cUgMVH
Y mi favorito hasta ahora, en el que utilicé visualizaciones circulares inspiradas en un tutorial de R Graph Gallery para visualizar los eventos de Trail Running más populares del mundo.
#TidyTuesday Week 44 - Ultra Trail Running
— Javier Tamayo-Leiva (@TamayoLeiva_J) October 29, 2021
This week I followed RGraphGallery's circular barplot tutorial to explore the most popular Ultra Trail Running events. @R_Graph_Gallery Thanks a lot!!!
[R Code] https://t.co/NOIMRYM8vs#ggplot2 #RGraphGallery #dataviz pic.twitter.com/mh8ghS9TU6