EXPLORAR DATOS (Data explorer)

  • show_available_elections(): Diccionario de elecciones disponibles. El parámetro viewer = TRUE habilita una tabla en el Viewer de RStudio (Dictionary of available elections. The viewer = TRUE parameter enables a table in the Viewer ofRStudio).

  • show_available_speech(): Diccionario de discursos presidenciales disponibles. El parámetro viewer = TRUE habilita una tabla en el Viewer de RStudio (Dictionary of available elections. The viewer = TRUE parameter enables a table in the Viewer ofRStudio).

  • show_arg_codes(): Diccionario de de distritos de Argentina. El parámetro viewer = TRUE habilita una tabla en el Viewer de RStudio y nivel permite elegir entre ‘provincias’ y ‘departamentos’ (Dictionary of available elections. The viewer = TRUE parameter enables a table in the Viewer ofRStudio and nivel allow selecting ‘provincia’ or ‘departamentos’ level).

OBTENER DATOS (Get data)

Elections

  • get_election_data(): Descarga bases de resultados electorales con parámetros obligatorios y otros optativos (Download electoral data with mandatory and other optional parameters).

Entre los primeros se deben consignar district para el distrito; category para la catgoría; round para el turno e year para el año de la elección. Entre los segundos se puede agregar levelpara el nivel de agregación -"provincia", "departamento", "circuito"- y long para el formato de los datos alargados donde las listas no van cada una en una columna sino como valores de una variable listas (Among the first, district; category;round andyear must be consigned. Between the seconds you can add level for the level of aggregation -"provincia","departmento","circuito"- andlong for long formatted data where party lists do not go in columns but as values of a lists variable).

  • get_multiple_elections(): Descarga múltiples bases de resultados electorales simultáneamente (Download multiple electoral data in one call).

Text

  • get_speech(): Descarga contenido de discurso presidencial. El parámetro raw = TRUE devuelve un data.frame con una columna discurso con el texto crudo. Caso contrario una versión del discurso tidy -con limpieza de datos y un token por fila (Download content of presidential speech. The raw = TRUE parameter returns a data.frame with a ‘discurso’ column with the raw text. Otherwise it returns a tidy speech version with clean dataand one token per row).

Geo

  • get_grid(): Descarga grilla de un distrito para graficar con geofacet (Download district grids to use with geofacet).

  • get_geo(): Descarga geometrías para visualizaciones gegoráficas con paquetes como sf (Download geometries for geo viz with packages like sf).


EJEMPLOS (Examples)

ELECTORAL

Explorar datos disponibles con show_available_elections() (Explore Data)

La función show_available_elections() muestra las elecciones disponibles para descarga. Por defecto el parámetro viewer = FALSE imprime el resultado en consola. Si en cambio escribimos viewer = TRUE los datos se presentan en el Viewer de RStudio y quedan a mano como tabla formateada y con la capacidad de ordenar y filtrar valores.

(show_available_elections () function displays available electoral data for download. By default the parameter viewer = FALSE prints the result in console. If instead we write viewer = TRUE data is presented in the RStudio Viewer as a handy formatted table and with the ability to sort and filter values).

  
library(polAr)

show_available_elections()
#> # A tibble: 425 x 5
#>    district category round  year  NOMBRE   
#>    <chr>    <chr>    <chr>  <chr> <chr>    
#>  1 arg      presi    balota 2015  ARGENTINA
#>  2 arg      presi    gral   2003  ARGENTINA
#>  3 arg      presi    gral   2007  ARGENTINA
#>  4 arg      presi    gral   2011  ARGENTINA
#>  5 arg      presi    gral   2015  ARGENTINA
#>  6 arg      presi    gral   2019  ARGENTINA
#>  7 arg      presi    paso   2011  ARGENTINA
#>  8 arg      presi    paso   2015  ARGENTINA
#>  9 arg      presi    paso   2019  ARGENTINA
#> 10 caba     dip      gral   2005  CABA     
#> # ... with 415 more rows

Obtener datos con get_election_data() (Get data)

get_election_data() es la función principal para hacernos de los datos disponibles. Los parámetros obligatorios son los que definen el distrito (district), la categoría (category), el turno (round) y el año electoral (year)

(get_election_data() is the main function to get the available data. The mandatory parameters are those that define the district (district), the category (category), the turn (round) and the electoral year (year)).

Por defecto los datos colapsan a nivel provincial, pero podemos definir otros niveles como departamento o circuito electoral con el parámetro levels

(By default the data collapses at the provincial level, but we can define other levels such as department or electoral circuit with the parameter levels).

Abajo el resultado de la consulta solo con los parámetros obligatorios, en el primer caso, y con un nivel de desagregación menor en el segundo (Below is the result of the query only with the mandatory parameters, in the first case, and with a lower level of disaggregation in the second):

  
get_election_data(district = "caba", 
                  category = "dip",
                  round = "paso", 
                  year = 2011,
                  long = FALSE)
#> # A tibble: 1 x 20
#> # Groups:   codprov [1]
#>   category round  year codprov name_prov electores blancos nulos `0023` `0036`
#>   <chr>    <chr> <dbl> <chr>   <chr>         <dbl>   <dbl> <dbl>  <dbl>  <dbl>
#> 1 dip      paso   2011 01      CABA        2491166   35478 27459 186276  68575
#> # ... with 10 more variables: 0179 <dbl>, 0302 <dbl>, 0501 <dbl>, 0504 <dbl>,
#> #   0508 <dbl>, 0509 <dbl>, 0510 <dbl>, 0517 <dbl>, 0518 <dbl>, 0536 <dbl>

Transformar estructura de datos anchos (wide) a largos (long) con make_long() (Transform data from wide to long).

Por defecto los datos se descargan en formato long. Pero si hubieramos descargado resultados en formato wide como en el ejemplo anterior, existe la posibilidad de transformarlos y cambiar a long usando la función auxiliar make_long()

(By default the data is downloaded in long format. But if we had downloaded results in wide format as in the previous example, there is the possibility to transform them and change to long using the auxiliary function make_long()).

Este sería el caso haciendo una llamada similar a la del ejemplo anterior pero ahora a nivel departamentoy guardandola en un objeto con nombre data (This would be the case by making a call similar to the previous example but now at the department level and saving it in an object with the name data.):

  
data <- get_election_data(district = "caba", 
                          category = "dip",
                          round = "paso", 
                          year = 2011, 
                          level = "departamento", long = FALSE) %>% 
  print()
#> # A tibble: 15 x 22
#> # Groups:   codprov, depto, coddepto [15]
#>    category round  year codprov name_prov depto coddepto electores blancos nulos
#>    <chr>    <chr> <dbl> <chr>   <chr>     <chr> <chr>        <dbl>   <dbl> <dbl>
#>  1 dip      paso   2011 01      CABA      Comu~ 001         185778    2403  1832
#>  2 dip      paso   2011 01      CABA      Comu~ 002         149091    1514  1516
#>  3 dip      paso   2011 01      CABA      Comu~ 003         167025    2538  1985
#>  4 dip      paso   2011 01      CABA      Comu~ 004         175190    2897  2040
#>  5 dip      paso   2011 01      CABA      Comu~ 005         152903    1944  1743
#>  6 dip      paso   2011 01      CABA      Comu~ 006         153077    1981  1651
#>  7 dip      paso   2011 01      CABA      Comu~ 007         169698    2522  1928
#>  8 dip      paso   2011 01      CABA      Comu~ 008         133174    2297  1468
#>  9 dip      paso   2011 01      CABA      Comu~ 009         144877    2521  1553
#> 10 dip      paso   2011 01      CABA      Comu~ 010         145632    2722  1647
#> 11 dip      paso   2011 01      CABA      Comu~ 011         166687    2500  1913
#> 12 dip      paso   2011 01      CABA      Comu~ 012         172984    2461  1991
#> 13 dip      paso   2011 01      CABA      Comu~ 013         208929    2366  2156
#> 14 dip      paso   2011 01      CABA      Comu~ 014         204174    2474  2043
#> 15 dip      paso   2011 01      CABA      Comu~ 015         161947    2338  1993
#> # ... with 12 more variables: 0023 <dbl>, 0036 <dbl>, 0179 <dbl>, 0302 <dbl>,
#> #   0501 <dbl>, 0504 <dbl>, 0508 <dbl>, 0509 <dbl>, 0510 <dbl>, 0517 <dbl>,
#> #   0518 <dbl>, 0536 <dbl>

Usamos la función auxiliar para convertir el formato de data (We use the helper function to convert the format of data):

  
data %>% 
  make_long() 
#> # A tibble: 210 x 10
#> # Groups:   codprov, depto, coddepto [15]
#>    category round  year codprov name_prov depto  coddepto electores listas votos
#>    <chr>    <chr> <dbl> <chr>   <chr>     <chr>  <chr>        <dbl> <chr>  <dbl>
#>  1 dip      paso   2011 01      CABA      Comun~ 001         185778 0023   13071
#>  2 dip      paso   2011 01      CABA      Comun~ 001         185778 0036    5425
#>  3 dip      paso   2011 01      CABA      Comun~ 001         185778 0179     563
#>  4 dip      paso   2011 01      CABA      Comun~ 001         185778 0302    3784
#>  5 dip      paso   2011 01      CABA      Comun~ 001         185778 0501   37804
#>  6 dip      paso   2011 01      CABA      Comun~ 001         185778 0504    6829
#>  7 dip      paso   2011 01      CABA      Comun~ 001         185778 0508    2876
#>  8 dip      paso   2011 01      CABA      Comun~ 001         185778 0509    8847
#>  9 dip      paso   2011 01      CABA      Comun~ 001         185778 0510   10629
#> 10 dip      paso   2011 01      CABA      Comun~ 001         185778 0517    5094
#> # ... with 200 more rows

Obtener nombres de listas o partidos políticos con get_names() (Get parties names)

Siguiendo el ejemplo anterior, una vez que data cambió a formato long se puede incorporar facilmente el nombre de los partios correspondientes al id de la columna listas con get_names()

(Following the example above, once data has changed to long format, you can easily enter the names of the partitions corresponding to the id of the lists column with get_names()):

  

data %>% 
  make_long %>% 
  get_names() 
#> # A tibble: 210 x 11
#> # Groups:   codprov, depto, coddepto [15]
#>    category round  year codprov name_prov depto  coddepto electores listas votos
#>    <chr>    <chr> <dbl> <chr>   <chr>     <chr>  <chr>        <dbl> <chr>  <dbl>
#>  1 dip      paso   2011 01      CABA      Comun~ 001         185778 0023   13071
#>  2 dip      paso   2011 01      CABA      Comun~ 001         185778 0036    5425
#>  3 dip      paso   2011 01      CABA      Comun~ 001         185778 0179     563
#>  4 dip      paso   2011 01      CABA      Comun~ 001         185778 0302    3784
#>  5 dip      paso   2011 01      CABA      Comun~ 001         185778 0501   37804
#>  6 dip      paso   2011 01      CABA      Comun~ 001         185778 0504    6829
#>  7 dip      paso   2011 01      CABA      Comun~ 001         185778 0508    2876
#>  8 dip      paso   2011 01      CABA      Comun~ 001         185778 0509    8847
#>  9 dip      paso   2011 01      CABA      Comun~ 001         185778 0510   10629
#> 10 dip      paso   2011 01      CABA      Comun~ 001         185778 0517    5094
#> # ... with 200 more rows, and 1 more variable: nombre_lista <chr>

FUENTES (Sources)

(Trabajo en proceso - Work in progress)

Electorales (Electoral)

  • La gran mayoría de los datos electorales proviene de las bases en archivos .mdb del Atlas Electoral de Andy Tow (Access to raw data comes from databases in .mdb files of Andy Tow Electoral Atlas).

  • La primera etapa de este proyecto consistió en un procesamiento de esos archivos para convertirlos a otros con formato sqlite para manipularlos más facilmente desde R(The first stage of this project consisted in processing those files and convert them to others in sqlite format for easier manipulation with R).

  • Con esa información generamos cuadernos de RMarkdown para hacer las consultas de resultados para distintos años, cateogrías, turnos electorales y distrito. Pronto una descripción más detallada y documentación de este proceso (With this information, we generate RMarkdown notebooks to query the results for different years, categories, electoral turns and district. Soon a more detailed description and documentation of this process).

Discursos (Speeches)

Con el aporte de Lucas Enrich y Camila Higa trabajamos sobre una base de datos de discursos de apertura de sesiones legislativas de los presidentes argentinos: desde el primer discurso de Justo José de Urquiza en 1854 hasta el de Alberto Fernández en 2020. Se disponibilizan versiones de texto con mínimo procesamiento y otras en formato tidy, siguiendo la definición de Julia Silge y David Robinson (With the contribution of Lucas Enrich and Camila Higat we worked on a database of speeches for the opening of legislative sessions of Argentine presidents: from the first speech by Justo José de Urquiza in 1854 to that of Alberto Fernández in 2020. Text versions are available with minimal processing and others in format tidy, following the definition of Julia Silge and David Robinson).