show_available_elections()
: Diccionario de elecciones disponibles. El parámetro viewer = TRUE
habilita una tabla en el Viewer de RStudio
(Dictionary of available elections. The viewer = TRUE
parameter enables a table in the Viewer ofRStudio
).
show_available_speech()
: Diccionario de discursos presidenciales disponibles. El parámetro viewer = TRUE
habilita una tabla en el Viewer de RStudio
(Dictionary of available elections. The viewer = TRUE
parameter enables a table in the Viewer ofRStudio
).
show_arg_codes()
: Diccionario de de distritos de Argentina. El parámetro viewer = TRUE
habilita una tabla en el Viewer de RStudio
y nivel
permite elegir entre ‘provincias’ y ‘departamentos’ (Dictionary of available elections. The viewer = TRUE
parameter enables a table in the Viewer ofRStudio
and nivel
allow selecting ‘provincia’ or ‘departamentos’ level).
get_election_data()
: Descarga bases de resultados electorales con parámetros obligatorios y otros optativos (Download electoral data with mandatory and other optional parameters).Entre los primeros se deben consignar district
para el distrito; category
para la catgoría; round
para el turno e year
para el año de la elección. Entre los segundos se puede agregar level
para el nivel de agregación -"provincia"
, "departamento"
, "circuito"
- y long
para el formato de los datos alargados donde las listas no van cada una en una columna sino como valores de una variable listas
(Among the first, district
; category
;round
andyear
must be consigned. Between the seconds you can add level
for the level of aggregation -"provincia"
,"departmento"
,"circuito"
- andlong
for long formatted data where party lists do not go in columns but as values of a lists
variable).
get_multiple_elections()
: Descarga múltiples bases de resultados electorales simultáneamente (Download multiple electoral data in one call).get_speech()
: Descarga contenido de discurso presidencial. El parámetro raw = TRUE
devuelve un data.frame con una columna discurso con el texto crudo. Caso contrario una versión del discurso tidy -con limpieza de datos y un token por fila (Download content of presidential speech. The raw = TRUE
parameter returns a data.frame with a ‘discurso’ column with the raw text. Otherwise it returns a tidy speech version with clean dataand one token per row).get_grid()
: Descarga grilla de un distrito para graficar con geofacet
(Download district grids to use with geofacet
).
get_geo()
: Descarga geometrías para visualizaciones gegoráficas con paquetes como sf
(Download geometries for geo viz with packages like sf
).
show_available_elections()
(Explore Data)La función show_available_elections()
muestra las elecciones disponibles para descarga. Por defecto el parámetro viewer = FALSE
imprime el resultado en consola. Si en cambio escribimos viewer = TRUE
los datos se presentan en el Viewer de RStudio
y quedan a mano como tabla formateada y con la capacidad de ordenar y filtrar valores.
(show_available_elections ()
function displays available electoral data for download. By default the parameter viewer = FALSE
prints the result in console. If instead we write viewer = TRUE
data is presented in the RStudio
Viewer as a handy formatted table and with the ability to sort and filter values).
library(polAr)
show_available_elections()
#> # A tibble: 425 x 5
#> district category round year NOMBRE
#> <chr> <chr> <chr> <chr> <chr>
#> 1 arg presi balota 2015 ARGENTINA
#> 2 arg presi gral 2003 ARGENTINA
#> 3 arg presi gral 2007 ARGENTINA
#> 4 arg presi gral 2011 ARGENTINA
#> 5 arg presi gral 2015 ARGENTINA
#> 6 arg presi gral 2019 ARGENTINA
#> 7 arg presi paso 2011 ARGENTINA
#> 8 arg presi paso 2015 ARGENTINA
#> 9 arg presi paso 2019 ARGENTINA
#> 10 caba dip gral 2005 CABA
#> # ... with 415 more rows
get_election_data()
(Get data)get_election_data()
es la función principal para hacernos de los datos disponibles. Los parámetros obligatorios son los que definen el distrito (district
), la categoría (category
), el turno (round
) y el año electoral (year
)
(get_election_data()
is the main function to get the available data. The mandatory parameters are those that define the district (district
), the category (category
), the turn (round
) and the electoral year (year
)).
Por defecto los datos colapsan a nivel provincial, pero podemos definir otros niveles como departamento o circuito electoral con el parámetro levels
(By default the data collapses at the provincial level, but we can define other levels such as department or electoral circuit with the parameter levels
).
Abajo el resultado de la consulta solo con los parámetros obligatorios, en el primer caso, y con un nivel de desagregación menor en el segundo (Below is the result of the query only with the mandatory parameters, in the first case, and with a lower level of disaggregation in the second):
get_election_data(district = "caba",
category = "dip",
round = "paso",
year = 2011,
long = FALSE)
#> # A tibble: 1 x 20
#> # Groups: codprov [1]
#> category round year codprov name_prov electores blancos nulos `0023` `0036`
#> <chr> <chr> <dbl> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
#> 1 dip paso 2011 01 CABA 2491166 35478 27459 186276 68575
#> # ... with 10 more variables: 0179 <dbl>, 0302 <dbl>, 0501 <dbl>, 0504 <dbl>,
#> # 0508 <dbl>, 0509 <dbl>, 0510 <dbl>, 0517 <dbl>, 0518 <dbl>, 0536 <dbl>
make_long()
(Transform data from wide to long).Por defecto los datos se descargan en formato long. Pero si hubieramos descargado resultados en formato wide como en el ejemplo anterior, existe la posibilidad de transformarlos y cambiar a long usando la función auxiliar make_long()
(By default the data is downloaded in long format. But if we had downloaded results in wide format as in the previous example, there is the possibility to transform them and change to long using the auxiliary function make_long()
).
Este sería el caso haciendo una llamada similar a la del ejemplo anterior pero ahora a nivel departamento
y guardandola en un objeto con nombre data
(This would be the case by making a call similar to the previous example but now at the department
level and saving it in an object with the name data
.):
data <- get_election_data(district = "caba",
category = "dip",
round = "paso",
year = 2011,
level = "departamento", long = FALSE) %>%
print()
#> # A tibble: 15 x 22
#> # Groups: codprov, depto, coddepto [15]
#> category round year codprov name_prov depto coddepto electores blancos nulos
#> <chr> <chr> <dbl> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl>
#> 1 dip paso 2011 01 CABA Comu~ 001 185778 2403 1832
#> 2 dip paso 2011 01 CABA Comu~ 002 149091 1514 1516
#> 3 dip paso 2011 01 CABA Comu~ 003 167025 2538 1985
#> 4 dip paso 2011 01 CABA Comu~ 004 175190 2897 2040
#> 5 dip paso 2011 01 CABA Comu~ 005 152903 1944 1743
#> 6 dip paso 2011 01 CABA Comu~ 006 153077 1981 1651
#> 7 dip paso 2011 01 CABA Comu~ 007 169698 2522 1928
#> 8 dip paso 2011 01 CABA Comu~ 008 133174 2297 1468
#> 9 dip paso 2011 01 CABA Comu~ 009 144877 2521 1553
#> 10 dip paso 2011 01 CABA Comu~ 010 145632 2722 1647
#> 11 dip paso 2011 01 CABA Comu~ 011 166687 2500 1913
#> 12 dip paso 2011 01 CABA Comu~ 012 172984 2461 1991
#> 13 dip paso 2011 01 CABA Comu~ 013 208929 2366 2156
#> 14 dip paso 2011 01 CABA Comu~ 014 204174 2474 2043
#> 15 dip paso 2011 01 CABA Comu~ 015 161947 2338 1993
#> # ... with 12 more variables: 0023 <dbl>, 0036 <dbl>, 0179 <dbl>, 0302 <dbl>,
#> # 0501 <dbl>, 0504 <dbl>, 0508 <dbl>, 0509 <dbl>, 0510 <dbl>, 0517 <dbl>,
#> # 0518 <dbl>, 0536 <dbl>
Usamos la función auxiliar para convertir el formato de data
(We use the helper function to convert the format of data
):
data %>%
make_long()
#> # A tibble: 210 x 10
#> # Groups: codprov, depto, coddepto [15]
#> category round year codprov name_prov depto coddepto electores listas votos
#> <chr> <chr> <dbl> <chr> <chr> <chr> <chr> <dbl> <chr> <dbl>
#> 1 dip paso 2011 01 CABA Comun~ 001 185778 0023 13071
#> 2 dip paso 2011 01 CABA Comun~ 001 185778 0036 5425
#> 3 dip paso 2011 01 CABA Comun~ 001 185778 0179 563
#> 4 dip paso 2011 01 CABA Comun~ 001 185778 0302 3784
#> 5 dip paso 2011 01 CABA Comun~ 001 185778 0501 37804
#> 6 dip paso 2011 01 CABA Comun~ 001 185778 0504 6829
#> 7 dip paso 2011 01 CABA Comun~ 001 185778 0508 2876
#> 8 dip paso 2011 01 CABA Comun~ 001 185778 0509 8847
#> 9 dip paso 2011 01 CABA Comun~ 001 185778 0510 10629
#> 10 dip paso 2011 01 CABA Comun~ 001 185778 0517 5094
#> # ... with 200 more rows
get_names()
(Get parties names)Siguiendo el ejemplo anterior, una vez que data
cambió a formato long se puede incorporar facilmente el nombre de los partios correspondientes al id de la columna listas
con get_names()
(Following the example above, once data
has changed to long format, you can easily enter the names of the partitions corresponding to the id of the lists
column with get_names()
):
data %>%
make_long %>%
get_names()
#> # A tibble: 210 x 11
#> # Groups: codprov, depto, coddepto [15]
#> category round year codprov name_prov depto coddepto electores listas votos
#> <chr> <chr> <dbl> <chr> <chr> <chr> <chr> <dbl> <chr> <dbl>
#> 1 dip paso 2011 01 CABA Comun~ 001 185778 0023 13071
#> 2 dip paso 2011 01 CABA Comun~ 001 185778 0036 5425
#> 3 dip paso 2011 01 CABA Comun~ 001 185778 0179 563
#> 4 dip paso 2011 01 CABA Comun~ 001 185778 0302 3784
#> 5 dip paso 2011 01 CABA Comun~ 001 185778 0501 37804
#> 6 dip paso 2011 01 CABA Comun~ 001 185778 0504 6829
#> 7 dip paso 2011 01 CABA Comun~ 001 185778 0508 2876
#> 8 dip paso 2011 01 CABA Comun~ 001 185778 0509 8847
#> 9 dip paso 2011 01 CABA Comun~ 001 185778 0510 10629
#> 10 dip paso 2011 01 CABA Comun~ 001 185778 0517 5094
#> # ... with 200 more rows, and 1 more variable: nombre_lista <chr>
(Trabajo en proceso - Work in progress)
La gran mayoría de los datos electorales proviene de las bases en archivos .mdb
del Atlas Electoral de Andy Tow (Access to raw data comes from databases in .mdb
files of Andy Tow Electoral Atlas).
La primera etapa de este proyecto consistió en un procesamiento de esos archivos para convertirlos a otros con formato sqlite
para manipularlos más facilmente desde R
(The first stage of this project consisted in processing those files and convert them to others in sqlite
format for easier manipulation with R
).
Con esa información generamos cuadernos de RMarkdown
para hacer las consultas de resultados para distintos años, cateogrías, turnos electorales y distrito. Pronto una descripción más detallada y documentación de este proceso (With this information, we generate RMarkdown
notebooks to query the results for different years, categories, electoral turns and district. Soon a more detailed description and documentation of this process).
Con el aporte de Lucas Enrich y Camila Higa trabajamos sobre una base de datos de discursos de apertura de sesiones legislativas de los presidentes argentinos: desde el primer discurso de Justo José de Urquiza en 1854 hasta el de Alberto Fernández en 2020. Se disponibilizan versiones de texto con mínimo procesamiento y otras en formato tidy, siguiendo la definición de Julia Silge y David Robinson (With the contribution of Lucas Enrich and Camila Higat we worked on a database of speeches for the opening of legislative sessions of Argentine presidents: from the first speech by Justo José de Urquiza in 1854 to that of Alberto Fernández in 2020. Text versions are available with minimal processing and others in format tidy, following the definition of Julia Silge and David Robinson).