Data Viz desde un amateur
y algunas moralejas

Joshua Kunst, Nov 16

Quien creo ser

De dia, alguien normal

De noche, hacker

Nah

  • Estadístico Y un mix de cosas debido a la experiencia
  • Evangelizador de R Oh sí!
  • Esporádicamente blogero Cuando el tiempo da
  • Me gusta escribir código Sep
  • Analizar y visualizar datos Cuado la imaginación da
  • Compartir todo lo anterior En forma de paquetes y posts

Que vengo a contar

De mi workflow de trabajo vida y del día a día

DSflow

Recomendaciones subjetivas y no tan tan subjetivas

tidyverse

Algunos post que he escrito en mi camino para pavimentar el vuestro

tpye

¿Qué preguntamos en Stack Overflow?

Contexto

  • StackOverflow (SO) es el sitio de Q&A más grande del universo
  • Preguntas de código, lenguajes, etc.
  • Mucha información

SOws

¿Por qué?

  • Por gusto, quería aprender a usar dplyr vía una base de datos sqlite
  • Era una base grande. Un xml de 27gb
  • Saber que es lo que más se pregunta ahora (y también antes)
  • Conocer estructura de subtemas

Pasos Claves

  • Importar todo ese gran xml a bbdd. Escribir un parser
  • Resumir millones de preguntas a información de tags
  • Conteos de tags por años
  • Conteos de preguntas por combinaciones de tags (2)

Ranking por año

Ranking por año

Relación tags/tags

Relación tags/tags vs2

tagstags { width: 200px; }

Moralejas

tagstags

Moralejas

  • Saber que conclusiones se pueden obtener de tus datos/viz
  • Siempre existen alternativas para visualizar mejor lo que se desea

Pokemon A visualizarlos todos

Contexto

  • Hace tiempo se venía pkmn go
  • Los vi cuando pequeños cuando eran 10, ahora son como mil
  • Quería hacer un post con la librería highcharter

Pasos Claves

  • Importar desde distintas fuentes datos, de estadísticas, colores, etc.
  • Partir de conteos a algo cada vez más complejo
  • Buscar una metodología para visualizar mucha información (observaciones y variables)

Partiendo contándolos

Agregando otra dimensión

Visualizándolos todos

Moralejas

  • Siempre se aprende algo nuevo. Apliqué un algoritmo TSNE que nunca antes había utlizando
  • Siempre todo se puede mejorar (ver 2do viz)

Comentarios Finales

  • PRogramen por que sí y también por que no.
  • Usen R (si quieren)
  • Si hacen las cosas por gusto, mucho más mejors
  • Espero les sirva un poco esta presentación ;) Gracias!