Trabajo elaborado para la asignatura “Programación y manejo de datos en la era del Big Data” de la Universitat de València durante el curso 2020-2021. La página web de la asignatura puede verse aquí: https://perezp44.github.io/intro-ds-20-21-web/. Los trabajos de mis compañeros de curso pueden verse aquí


1. Introducción

En la asignatura de “Programación y manejo de datos en la era del Big Data” 1 tenemos que hacer un trabajo de tema libre, por lo que nos parecia interesante hacerlo de un tema que nos afecta a todos, como es la evolución de la pandemia de la Covid-19

Por ello, hemos buscado diferentes conjuntos de datos con los que poder hacer el análisis. Y así, mostrar de una forma más visual y sencilla diferentes cuestiones que nos pueden surgir al pensar en la Covid-19. Como por ejemplo, que incidencia de contagios ha habido dependiendo de la província o CCAA, donde se han hecho más pruebas pcr o test de ac o que paises han controlado mejor o peor la pandemía, entre otras cuestioenes.

2. Contexto mundial de la Covid-19


ORIGEN DEL COVID-19

La Covid-19 es una enfermedad infecciosa causada por un coronavirus recientemente descubierto.

Tuvo su origen en la ciudad de Wuhan, en China. Y el primer caso diagnosticado fue el 17 de noviembre de 2019. Todo y que se ha expandido rapidamente por todo el mundo.


¿QUÉ ES EL CORONAVIRUS

Los coronavirus son una serie de virus llamados así por su forma. Estos organismos no son nuevos, ya que conviven con el ser humano desde siempre. Además, hay muchos tipos de ellos, tanto en animales como en seres humanos.

Sin embargo, el análisis comparativo de esta enfermedad determinó que el SARS-CoV-2 era lo suficientemente distinto de los otros coronavirus de gravedad detectados en humanos (SARS y MERS) como para que este fuera consdierado una nueva enfermedad, recibiendo el nombre de Covid-19.


¿CÓMO SE PROPAGA EL COVID-19?

El virus que causa la Covid-19 se transmite principalmente a través de la gotículas generadas cuando una persona infectada tose, estornuda o espira. 2

Estas gotículas son demasiado pesadas para permanecer suspendidas en el aire y caen rapidamente sobre el suelo y/o las superfícies, conviertiendose estas en otra forma posible de contagio.

3. Datos utilizados para el trabajo.

Datos

Obtener los datos es fundamental para poder hacer el análisis.

Por ello, para el presente trabajo utilizaremos los datos que hemos extraido en diferentes páginas web, referenciadas al final del informe (en Referencias), y que hemos modificado para poder hacer este análisis.

De manera que, los datos modificado aparecen en la pestaña Tidy. Estos corresponden a aquellos que contienen información sobre los contagiados, recuperados y fallecidos a nivel mundial, estatal y autonómico.

Así como otras cifras, sobre las diferentes pruebas realizadas (PCR’s y Test rápidos), la saturación del sistema santiario español y algunos efectos económicos de la pandemía.

Tidy

La finalidad de este apartado es poner los código que hemos utilizado para “limpiar” los datos y a partir de los cuales hemos podido hacer gráficos, mapas, tablas…

#TIDY PARA EL "MUNDO".

library(rio)
library(tidyverse)

url_mundo <- "https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"

df_mundo <- readr::read_csv(url_mundo)

df_mundo <- df_mundo %>% select(-"Province/State") %>%
            separate(Date, c("Año","Mes","Dia"), sep = "-")

df_mundo <- df_mundo  %>%
            relocate("Country/Region", .before=Año) %>%
            relocate(Año, .before=Confirmed)

df_mundo <- df_mundo %>%
            relocate(Mes, .after=Dia)

#A fecha del 01/12:

df_mundo_12 <- df_mundo %>% filter(Mes == "12" & Dia == "01")
df_mundo_12 <- df_mundo_12 %>% select(-Deaths)

#Para ver que hay países que se repiten y habrá que sumar todos los que se repiten:

df <- df_mundo_12 %>% group_by(`Country/Region`) %>% summarise(N = n())
#Países que se repiten: Australia, Canada, China, Denmark, France, Netherlands, United Kingdom.

df_b <- df_mundo_12 %>% filter(!(`Country/Region` %in% c("Australia", "Canada", "China", "Denmark", "France", "Netherlands", "United Kingdom")))


#Para Australia:
df_A <- df_mundo_12 %>% filter(`Country/Region` %in% "Australia")
df_cA <- df_A %>% mutate(Confirmed = sum(Confirmed))
df_cA <- df_cA %>% mutate(Recovered = sum(Recovered))
df_cA <- df_cA %>% slice(1)

#Para China:
df_C <- df_mundo_12 %>% filter(`Country/Region` %in% "China")
df_c <- df_C %>% mutate(Confirmed = sum(Confirmed))
df_c <- df_c %>% mutate(Recovered = sum(Recovered))
df_c <- df_c %>% slice(1)

#Para Denmark:
df_D <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_d <- df_D %>% mutate(Confirmed = sum(Confirmed))
df_d <- df_d %>% mutate(Recovered = sum(Recovered))
df_d <- df_d %>% slice(1)

#Para France:
df_F <- df_mundo_12 %>% filter(`Country/Region` %in% "France")
df_f <- df_F %>% mutate(Confirmed = sum(Confirmed))
df_f <- df_f %>% mutate(Recovered = sum(Recovered))
df_f <- df_f %>% slice(1)

#Para Netherlands:
df_N <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_n <- df_N %>% mutate(Confirmed = sum(Confirmed))
df_n <- df_n %>% mutate(Recovered = sum(Recovered))
df_n <- df_n %>% slice(1)

#Para United Kingdom:
df_U <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_u <- df_U %>% mutate(Confirmed = sum(Confirmed))
df_u <- df_u %>% mutate(Recovered = sum(Recovered))
df_u <- df_u %>% slice(1)


#Ahora tengo que juntar las tablas:
tabla <- bind_rows(df_b, df_u, df_n, df_f, df_d, df_c, df_cA)
#Gráficos de la evolución del Covid-19
library(tidyverse)
url_mundo <- "https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"

df_mundo <- readr::read_csv(url_mundo)

df_mundo <- df_mundo %>% select(-"Province/State") %>%
            separate(Date, c("Año","Mes","Dia"), sep = "-")

df_mundo <- df_mundo  %>%
            relocate("Country/Region", .before=Año) %>%
            relocate(Año, .before=Confirmed)

df_mundo <- df_mundo %>%
            relocate(Mes, .after=Dia)
#Estos datos muestran el número de muertes diarias en el mundo, los hemos arreglado para poder hacer un facet_wrap con los diferentes meses y la evolución de estos según los dias. 
library(tidyverse)

#Para la tabla de muertes_dia hacemos, separamos por día y mes. Y filtrar las fechas hasta des de las primeras disponibles hasta el 31 de octubre.

library(lubridate)

muertes_dia <- rio::import(here::here("datos", "muertes_dia.xlsx"))

muertes_dia <- muertes_dia %>% mutate(Dia= day(Date)) %>% mutate(Mes= month(Date))  %>%
filter(!Mes == "11")  %>% select(!Date)

muertes_dia <- muertes_dia %>% mutate(Mes = case_when(
  Mes == 1 ~ "Enero",
  Mes == 2 ~ "Febrero",
  Mes == 3 ~ "Marzo",
  Mes == 4 ~ "Abril",
  Mes == 5 ~ "Mayo",
  Mes == 6 ~ "Junio",
  Mes == 7 ~ "Julio",
  Mes == 8 ~ "Agosto",
  Mes == 9 ~ "Septiembre",
  Mes == 10 ~ "Octubre",
))

muertes_dia$facet = factor(muertes_dia$Mes, levels = c("Enero","Febrero","Marzo", "Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre"))
#Datos_CCAA
urla <-"https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv"
aaa <- rio::import(urla)

#Hay que tener en cuenta que la variable % Camas Ocupadas UCI Covid no tiene datos hasta el 21-09-2020 por lo tanto para analizar la segunda OLA si que nos sirve pero no para la primera
library(tidyverse)


datos_CCAA <- aaa %>%
  separate(Fecha, c("Año","Mes","Dia"), sep = "-") %>%
  select(-CCAA) %>% mutate(CCAA = case_when(
  cod_ine == 0 ~ "España",
  cod_ine == 1 ~ "Andalucia",
  cod_ine == 2 ~ "Aragon",
  cod_ine == 3 ~ "Asturias",
  cod_ine == 4 ~ "Islas Baleares",
  cod_ine == 5 ~ "Canarias",
  cod_ine == 6 ~ "Cantabria",
  cod_ine == 7 ~ "Castilla Leon",
  cod_ine == 8 ~ "Castilla La Mancha",
  cod_ine == 9 ~ "Cataluña",
  cod_ine == 10 ~ "Com.Valenciana",
  cod_ine == 11 ~ "Extremadura",
  cod_ine == 12 ~ "Galicia",
  cod_ine == 13 ~ "Madrid",
  cod_ine == 14 ~ "Murcia",
  cod_ine == 15 ~ "Navarra",
  cod_ine == 16 ~ "Pais Vasco",
  cod_ine == 17 ~ "La Rioja",
  cod_ine == 18 ~ "Ceuta",
  cod_ine == 19 ~ "Melilla",
)) %>% relocate(CCAA, .after=cod_ine)

datos_CCAA <- datos_CCAA %>% rename("Ingresos Ult.24h" = "Ingresos COVID últimas 24 h") %>% rename("Altas Ult24h" = "Altas COVID últimas 24 h")
library(rio)
library(tidyverse)
#link: https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv

dfp <- rio::import(here::here("datos", "datos_pruebas.xlsx"))

dfa <-dfp %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes) %>% select(!OTROS_TESTS) %>% select(!OTROS_TESTS_x_1000hab.)

dfCCAA <- dfa %>% filter(CCAA != "España")

#Exporto los datos para poder empezar el análisis desde aquí.
#rio::export(dfCCAA, here::here("datos", "dfCCAA.csv"))

dfCCAA <- rio::import(here::here("datos", "dfCCAA.csv"))

dfCCAA <- dfCCAA %>% select(!CCAA)
dfCCAA <- dfCCAA %>% mutate(CCAA = case_when(
  cod_ine == 1 ~ "Andalucia",
  cod_ine == 2 ~ "Aragon",
  cod_ine == 3 ~ "Asturias",
  cod_ine == 4 ~ "I.Baleares",
  cod_ine == 5 ~ "Canarias",
  cod_ine == 6 ~ "Cantabria",
  cod_ine == 7 ~ "Castilla Leon",
  cod_ine == 8 ~ "Castilla La Mancha",
  cod_ine == 9 ~ "Cataluña",
  cod_ine == 10 ~ "C.Valenciana",
  cod_ine == 11 ~ "Extremadura",
  cod_ine == 12 ~ "Galicia",
  cod_ine == 13 ~ "Madrid",
  cod_ine == 14 ~ "Murcia",
  cod_ine == 15 ~ "Navarra",
  cod_ine == 16 ~ "Pais Vasco",
  cod_ine == 17 ~ "La Rioja",
  cod_ine == 18 ~ "Ceuta",
  cod_ine == 19 ~ "Melilla",
)) %>% relocate(CCAA, .after=cod_ine)
library(rio)
library(tidyverse)

dfPROV <- rio::import(here::here("datos", "dfTrel.csv"))

dfPROV <- mutate(dfPROV %>% mutate(Cod = case_when(
     provincia == "Alava" ~ "01",
     provincia == "Albacete" ~ "02",
     provincia == "Alicante" ~ "03",
     provincia == "Almeria" ~ "04",
     provincia == "Avila" ~ "05",
     provincia == "Badajoz" ~ "06",
     provincia == "Islas Baleares" ~ "07",
     provincia == "Barcelona" ~ "08",
     provincia == "Burgos" ~ "09",
     provincia == "Caceres" ~ "10",
     provincia == "Cadiz" ~ "11",
     provincia == "Castellon" ~ "12",
     provincia == "Ciudad Real" ~ "13",
     provincia == "Cordoba" ~ "14",
     provincia == "A Coruña" ~ "15",
     provincia == "Cuenca" ~ "16",
     provincia == "Girona" ~ "17",
     provincia == "Granada" ~ "18",
     provincia == "Guadalajara" ~ "19",
     provincia == "Guipuzcoa" ~ "20",
     provincia == "Huelva" ~ "21",
     provincia == "Huesca" ~ "22",
     provincia == "Jaen" ~ "23",
     provincia == "Leon" ~ "24",
     provincia == "Lleida" ~ "25",
     provincia == "La Rioja" ~ "26",
     provincia == "Lugo" ~ "27",
     provincia == "Madrid" ~ "28",
     provincia == "Malaga" ~ "29",
     provincia == "Murcia" ~ "30",
     provincia == "Navarra" ~ "31",
     provincia == "Ourense" ~ "32",
     provincia == "Asturias" ~ "33",
     provincia == "Palencia" ~ "34",
     provincia == "Las Palmas" ~ "35",
     provincia == "Pontevedra" ~ "36",
     provincia == "Salamanca" ~ "37",
     provincia == "Tenerife" ~ "38",
     provincia == "Cantabria" ~ "39",
     provincia == "Segovia" ~ "40",
     provincia == "Sevilla" ~ "41",
     provincia == "Soria" ~ "42",
     provincia == "Tarragona" ~ "43",
     provincia == "Teruel" ~ "44",
     provincia == "Toledo" ~ "45",
     provincia == "Valencia" ~ "46",
     provincia == "Valladolid" ~ "47",
     provincia == "Bizkaia" ~ "48",
     provincia == "Zamora" ~ "49",
     provincia == "Zaragoza" ~ "50",
     provincia == "Ceuta" ~ "51",
     provincia == "Melilla" ~ "52")))

dfPROV <- dfPROV %>% select(provincia, Cod, Poblacion, Total, Totalxcap) %>% arrange(Cod)
#Preparando los datos para el análisis de las provincias
library(tidyverse)

df_prov <- rio::import(here::here("datos", "datos_provincias.csv"))

df_prov <- df_prov %>% separate(fecha, c("dia","mes","año"), sep = "--")

df_prov <- df_prov %>% select(provincia_iso, provincia, dia, mes, año, num_casos)

library(rio)

rio::export(df_prov, here::here("datos", "datos_provinciasok.csv"))

df <- rio::import(here::here("datos", "datos_provinciasok.csv"))

dfg <- df %>% select(-provincia_iso) %>% select(-año)

dfhab <- rio::import(here::here("datos", "excel_hab_prov.xlsx"))

tabla <- full_join(dfg, dfhab, by = c("provincia" = "Provincia"))

dfgg <- tabla %>% group_by(provincia, mes, Poblacion) %>% summarise(Num = sum(num_casos))

dfgg <- dfgg %>% select(provincia, Poblacion, mes, Num)


dfrel <- dfgg %>% mutate(Total_cap = (Num/Poblacion))
dfT <- dfgg %>% group_by(provincia, Poblacion) %>% summarise(Total = sum(mes, Num))

dfTrel <- dfT %>% mutate(Totalxcap = (Total/Poblacion))

unique(dfTrel$provincia)
#>  [1] "A Coruña"               "Alava"                  "Albacete"              
#>  [4] "Alicante"               "Almeria"                "Asturias"              
#>  [7] "Avila"                  "Badajoz"                "Barcelona"             
#> [10] "Bizkaia"                "Burgos"                 "Caceres"               
#> [13] "Cadiz"                  "Cantabria"              "Castellon"             
#> [16] "Ceuta"                  "Ciudad Real"            "Cordoba"               
#> [19] "Cuenca"                 "Girona"                 "Granada"               
#> [22] "Guadalajara"            "Guipuzcoa"              "Huelva"                
#> [25] "Huesca"                 "Islas Baleares"         "Jaen"                  
#> [28] "La Rioja"               "Las Palmas"             "Leon"                  
#> [31] "Lleida"                 "Lugo"                   "Madrid"                
#> [34] "Malaga"                 "Melilla"                "Murcia"                
#> [37] "Navarra"                "Ourense"                "Palencia"              
#> [40] "Pontevedra"             "Salamanca"              "Santa Cruz de Tenerife"
#> [43] "Segovia"                "Sevilla"                "Soria"                 
#> [46] "Tarragona"              "Teruel"                 "Toledo"                
#> [49] "Valencia"               "Valladolid"             "Zamora"                
#> [52] "Zaragoza"
dfTrel$provincia <- gsub("Santa Cruz de Tenerife", "Tenerife",dfTrel$provincia)

rio::export(dfTrel, here::here("datos", "dfTrel.csv"))

4. Estudio sobre los Datos del MUNDO

4.1 Preguntas y respuestas de la situación actual.

df <- rio::import(here::here("datos", "tabla_mundo.csv"))

#Con esto podemos hacer unas tablas.

dfmax1 <- df %>% slice_max(Confirmed, n=1) #Estados Unidos es el país con más contagios.

dfmax2 <- df %>% slice_max(Recovered, n=1) #El máximo de recuperados está en India.

df_min1 <- df %>% slice_min(Confirmed, n=1) #El país con menos contagios es Vanuatu (es un país Oceania)
#TABLA PARA EL PAÍS CON MENOS CONATGIOS.

Imagen <- "http://banderasmundo.es/wp-content/uploads/2017/09/vanuatu.png"

df_min1 <- df_min1 %>% add_column(Imagen)
df_min1 <- df_min1 %>% select(-c(Dia, Mes, Año))

library(gt)
Tabla_Pmencotag <- df_min1 %>% gt()

Tabla_Pmencotag <- Tabla_Pmencotag %>%
                   tab_header(title = md("**País con menos contagios de Covid-19**"),subtitle = md("A fecha: 1/12/2020"))

Tabla_Pmencotag <- Tabla_Pmencotag %>%
                tab_options(heading.background.color = "coral") %>% tab_options(heading.title.font.size = 15, heading.subtitle.font.size = 13,  column_labels.font.weight =  "bold")


Tabla_Pmencotag <- Tabla_Pmencotag  %>%
  gt::text_transform(locations = cells_body(columns = vars(Imagen)), fn = function(x) {gt::web_image(x, height = 50)}) %>%  cols_align(
    align = "center")

#Lo mismo hacemos para las otras tres tablas

¿CUÁL ES EL PAÍS CON MÁS PERSONAS CONTAGIADAS?


País con más contagios de Covid-19
A fecha: 1/12/2020
Country/Region Confirmed Recovered ImagenUS
US 13721858 5226581


¿EN QUÉ PAÍS HAY MÁS PERSONAS RECUPERADAS?


País con más recuperados de Covid-19
A fecha: 1/12/2020
Country/Region Confirmed Recovered ImagenI
India 9499413 8932647


¿CUÁL ES EL PAÍS CON MENOS CONTAGIOS?


País con menos contagios de Covid-19
A fecha: 1/12/2020
Country/Region Confirmed Recovered Imagen
Vanuatu 1 0

El país más afectado hoy en día por la pandemia es Estados Unidos, como podremos confirmar a lo largo del análisis. Además, India pese a que tiene un gran número de recuperados (en la fecha indicada en la tabla) no deja de tener contagiados y su cifra va en aumento.

Filtrando los datos extraidos del repositorio de Github Covid-19, hemos obtenido que el país con menos contagios es Vanuatu, un país insular de Ocenia, que en estos momentos tiene solo 1 persona confirmada de coronavirus, por lo que es el país con menos casos hasta el momento. (Además, cabe tener en cuenta que esta isla cuenta con muy poca población (292.680 habitantes))

4.2 Los 10 países con más casos de Coronavirus, ¿Cuáles son?

a <- ggplot(covid)+
  geom_col(aes(ranking,cu_cases,fill=cname))+
  scale_fill_manual(values=mycolors)+
  geom_text(aes(ranking,cu_cases,label=as.factor(cu_cases)),hjust=-0.1,size=5)+
  geom_text(aes(ranking, y=0 , label = cname), hjust=1.1,size=5) +
  geom_text(aes(x=10, y=max(cu_cases) , label = as.factor(date)), vjust = 0, hjust=1, alpha = 0.1,  col = "black", size = 20)+
  labs(title = "Evolución de los casos positivos de Covid-19 en el mundo",
       subtitle = "Datos de la Universidad Johns Hopkins",
       x=NULL,
       y=NULL)+
  coord_flip(clip = "off")+
  scale_x_reverse()+
  theme_minimal()+
  theme(legend.position = "none",
        axis.title.y = element_blank(),
        axis.title.x = element_blank(),
        axis.text.y = element_blank(),
        axis.text.x = element_blank(),
        plot.title = element_text(hjust = 0, size=20,face="bold"),
        plot.subtitle = element_text(hjust = 0, size=12, face="italic"),
        plot.margin = margin(1, 4, 1, 3, "cm"))+
  transition_states(date,transition_length = 1,state_length = 0,wrap = FALSE)
 animate(a,
        nframes = 800,
        fps = 24,
        end_pause = 200,
        width = 1000,
        height = 600,
        type = "cairo")

Con el anterior gráfico pretendemos mostrar la evolución de los casos positivos en coronavirus, mostrando los 10 países que se encuentran en el “top”. Estos datos van desde incioos de enero hasta principios de diciembre (año 2020)

Observamos que China es el primer país en tener positivos en coronavirus, como sabemos Wuhan fue el lugar donde se detectó el primer positivo. El coronavirus se propaga rapidamente por todo el mundo y vemos a través del gráfico que Italia y España rapidamente pasan a tener un número elevado de contagios, el cual es superado por Estados Unidos en marzo, donde los casos crecen de manera exponencial.

Los últimos datos mostrados indican que India, Brasil y Rusia se situan en la segunda, tercera y cuarta posición respectivamente en contagios. En decima posición se encuentra México con 1.144.643 de casos acumulados.

4.3 Evolución de los contagios (a nivel mundial)

Para poder entender como ha sido la propagación del virus a nivel mundial nos parecia interesante analizar diferentes países que no fueran parecidos entre si. Para ello elegimos estos países - Estados Unidos, Nigeria, Portugal y Japón - e hicimos un gráfico donde mostramos la evolución de los casos registrados diariamente.

#Gráfico para US:
df_mundoUS<- df_mundo %>% filter(`Country/Region` == "US") %>% select(-c(Recovered, Deaths))

df_mundoUSS <- df_mundoUS %>% summarise(dif = diff(Confirmed))

dfUS <- df_mundoUS %>% select(`Country/Region`,Dia, Mes)
dfUS <- dfUS %>% slice(-1)
US <- bind_cols(dfUS, df_mundoUSS)

US <- US %>% mutate(ranking = row_number())

graficoUS <- ggplot(US, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "EEUU",  x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) +  theme(legend.position = "none")

#Ibamos ha hacerlo también de Australia, pero no lo he hecho porque el número de casos es bastante bajo y la diferencia entre un día y otro sale negativa. (Por lo que el gráfico no se ve bien)

#Mismo proceso para Nigeria, Japón y Portugal
#Por tanto, pongo el código para que no se vea. (echo=FALSE)

Cabe tener en cuenta que los colores muestran los diferentes meses, empezando en Enero y acabando en Noviembre.

A la vista del gráfico observamos que la evolución en los distintos países es muy diferente. En PORTUGAL, al principio de la pandemia se muestra un aumento en la curva, aunque es muy poco pronunciado y seguidamente los casos bajan y se mantienen en valores muy bajos durante un período de tiempo (meses) largo hasta que empieza la segunda ola donde los casos se disparan teniendo su máximo en casi 8000 casos registrados en un solo dia.

La evolución de NIGERIA, en cambio es muy diferente en este país el virus llega más tarde que los demás y la primera ola parece ser mayor que la segunda, aunque no se pueden tampoco sacar demasiadas conclusiones ya que el sistema sanitario de este país no es comparable al de los otros tres países analizados.

JAPÓN, sufre como vemos en el gráfico tres picos muy claros. `El primero, al principio de la pandémia, el siguiente unos meses más tarde y cuando parecia que podian controlar la situación los casos empezaron a aumentar progresivamente hasta llegar a máximos nunca vistos antes en la pandemia.

Por último, el caso de ESTADOS UNIDOS es diferente ya que la curva es siempre ascendente y no ofrece cambios extremadamente bruscos como la de los otros países. Su tendencia es clara, cada vez mas casos teniendo el pico máximo en las fechas más recientes


Continuamos con el análisis a nivel mundial, para ello ahora utilizaremos el paquete tidycovid19

#remotes::install_github("joachim-gassen/tidycovid19")
library(tidycovid19)

#install.packages("maps")
library(lubridate)

merged <- download_merged_data(cached = TRUE, silent = TRUE)

a <- plot_covid19_stripes(
  type = "confirmed",
  countries = c("CHN" , "ESP",  "BRA", "ZAF", "UK", "USA"),
  sort_countries = "countries")

a <- a + theme_test() +  theme(legend.direction = "horizontal") + theme(legend.position = "bottom") +
  labs(title = "COVID-19 -CASOS DIARIOS", subtitle = " Muestra el cambio diario en casos confirmados (promedio de 7 días)", caption = "Datos obtenindos de Johns Hopkins University CSSE Github
  Repo: https://github.com/joachim-gassen/tidycovid19.
       Últimos datos obtenidos 09/12/2020")  
     

a <- a + theme(plot.title = element_text(hjust = 0.5)) +  theme(plot.subtitle = element_text(hjust = 0.5))  

[Ampliar Imagen]

En el gráfico anterior se contrasta lo que se ha comentado anteriormente. El país con más casos diarios actualmente es Estados Unidos, su tendencia es clara, como se ha dicho antes, no paran de aumentar los casos. Parecida a esta es la tendencia que observamos en Brasil, donde el primer caso se confirmó el 25 de febrero de 2020, en el estado de São Paulo, por parte de un brasileño que viajó a Italia con sintomas leves.

Por otra parte tenemos a España y Sud-Africa, sus gráficos si muestran las famosas olas donde los casos aumentaban paro luego se reducian. Concretamente en el caso de España se pueden ver como hacia el final, meses más recientes, vuelven a aparecer tonos mas verdosos lo que significa que los casos han disminuido, en comparación con los meses de marzo-abril.

El país restante es China donde según los datos que tenemos la Pandemia esta controlada ya que los valores son infimos para la población que tiene el gigante asiático. Además, se observa que al principio de la crisi sanitaria presentaba más casos que el resto de países analizados (en este gráfico)


mapaCD <- map_covid19(
  data = download_merged_data(cached = TRUE, silent = TRUE),
  type = "deaths",
  cumulative = FALSE,
  change_ave = 7,
  per_capita = TRUE)

library(ggplot2)
mapaCD <- mapaCD + labs(title = "COVID-19",
                        subtitle = "Muestra la variación diaria de muertes por 100.000 habitantes (promedio durante 7 dias)", caption = "Datos del día 07/12/2020,  
Datos obtenindos de Johns Hopkins University CSSE Github Repo: https://github.com/joachim-gassen/tidycovid19.") +
  theme(plot.title = element_text(hjust = 0.5)) +  
  theme(plot.subtitle = element_text(hjust = 0.5))

mapaCD +   scale_fill_viridis_c(direction = -1)

[Ampliar Imagen]

Este mapa nos muestra la variación de muertes por 100 mil habitantes en un promedio de 7 días. Los datos son de la semana del 7 de diciembre. En este mapa, se puede recalcar que la zona más afectada por muertes por COVID es el centro de Europa, donde podríamos destacar países como Italia, Eslovenia o Bulgaria. Otro de los países más afectados por el coronavirus sin duda es Estados Unidos donde destaca tanto en muertes, como en contagios. También se puede ver que los países donde menos muertes por 100 mil habitantes están habiendo, son países de África, Oceanía y parte de Asia.

mapaCC <- map_covid19(
  data = download_merged_data(cached = TRUE, silent = TRUE),
  type = "confirmed",
  cumulative = FALSE,
  change_ave = 7,
  per_capita = TRUE)

mapaCC <- mapaCC + labs(title = "COVID-19 - CASOS CONFIRMADOS",
                        subtitle = "Muestra la variación diaria de casos confirmados por 100.000 habitantes (promedio durante 7 dias)", caption = "Datos del día 07/12/2020,  
Datos obtenindos de Johns Hopkins University CSSE Github Repo: https://github.com/joachim-gassen/tidycovid19.") +
  theme(plot.title = element_text(hjust = 0.5)) +  
  theme(plot.subtitle = element_text(hjust = 0.5))

mapaCC + scale_fill_viridis_c(direction = -1)

[Ampliar Imagen]

Este mapa nos muestra la variación de casos confirmados por 100 mil habitantes en un promedio de 7 días. Los datos so de la semana del 7 de diciembre.

Como podemos observar, las zonas donde menos casos se confirman son en zonas de África (hay que tener en cuenta que se realizan menos pruebas que en el resto de los continentes) Por otro lado, hay otras zonas como Australia y parte de Asia donde también hay pocos contagios confirmados.

Las zonas más afectadas serían zonas de Europa, Rusia y Estados Unidos.


#remotes::install_github("joachim-gassen/tidycovid19")
library(ggplot2)
library(tidyverse)
library(tidycovid19)

dfz <- download_merged_data(silent = TRUE, cached = TRUE)

dfz <- dfz %>% group_by(iso3c) %>% summarise(
    confirmed_cases = max(confirmed, na.rm = TRUE),
    soc_dist_measures = max(soc_dist)
  ) %>% filter(confirmed_cases >= 1000)

DF <- dfz %>% arrange(desc(confirmed_cases))

DF <- dfz %>% slice_max(confirmed_cases, n=20)%>% slice(-7)

ggplot(DF, aes(x = confirmed_cases, y = soc_dist_measures, color = iso3c)) + geom_point() +
scale_x_continuous(trans='log10', labels = scales::comma) +
ggrepel::geom_label_repel(ggplot2::aes(label = iso3c)) + labs(title = "RELACIÓN ENTRE LOS CASOS CONFIRMADOS Y LAS MEDIDAS TOMADAS",
subtitle = "Relación hecha para los 20 países con más contagios" ,caption = "Datosdel repositorio de Github de CSSE de la Uni.
Johns Hopkins. Paquete <<tidycovid19>>", y = "Medidas distancia social", x = "Casos confirmados") +
theme_bw() +  theme(legend.position = "none") +  theme(plot.title = element_text(hjust = 0.5)) +  theme(plot.subtitle = element_text(hjust = 0.5))

En este gráfico se muestra la relación existente entre el número de casos (contagios) y el número de medidas de distanciamiento social aplicadas en cada uno de los países de la muestra (netos de restricciones levantadas)

Se encargan de recopilar estos datos ACAPS, un proyecto no gubernamental. 3

En este caso se muestra el número de medidas de distanciamiento social informadas hasta la fecha por ACAPS, neto de restricciones levantadas. Todo y que también se puede ver la relación con otras medidas que recoge este proyecto, tales como el número de medidas sociales y económicas o de reestricciones de movimiento, etc.

De acuerdo con el gráfico, observamos que el país del mundo con más contagios actualmente, Estados Unidos, ha aplicado un nivel de medidas de distancia social muy bajo, en comparación con otros países, como en Gran Bretaña, donde Boris Johnson se ha visto obligado a imponer reglas de distanciamiento social dado la desbordada situación en la que se encontraba. Teniendo en cuenta además, que al inicio de la pandemia evitó poner medidas drásticas, todo y que su estratégia tuvo que cambiar al ver que el virus estaba cogiendo fuerza en su país.

España se encuentra a día de hoy con 1,73 M de casos acumulados, las estrategias para reducir el contagio se han basado principalmente en reducir la movilidad de las personas, por ello, el 13 de marzo se declaró el Estado de Alarma con confinamiento domiciliario. Esta primera cuarentena se levantó el pasado 21 de junio, con una reducción considerable de los casos. Todo y que ha aumentado en los meses posteriores, haciendo referencia a la “segunda ola” (o incluso, algunos hablan de una “tercera ola”)

4.4 Evolución de los fallecidos (a nivel mundial)

library(gganimate)
library(plotly)

graficoM <- ggplot(muertes_dia , aes(Dia , Daily_Deaths,  color= Mes))  + geom_line() + geom_point() +
  labs(title = "Evolución de muertes al día en el mundo por Covid",
    subtitle = "Desde el 24 de Enero hasta el 31 de Octubre", caption = "Elaboración propia con datos 
    del repositorio COVID19",
    y = "Muertes diarias", x = "Dias") +  
  theme(legend.position = "none") + scale_x_continuous(breaks = seq(1, 30, 5)) + 
  facet_wrap(~facet, nrow = 4, ncol = 3)  + transition_reveal(Dia)

En el siguiente conjunto de gráficos observamos la evolución de las muertes por Covid en todo el mundo.

Como podemos observar es a partir del tercer mes, el mes de Marzo cuando las muertes empiezan a ser significativas llegando al máximo total en Abril donde rozaron las 8000 muertes en un dÍa. A partir de ahí y en vista de los gráficos observamos que las cifras tienen tendencias muy parecidas, es decir, se mantiene bastante constante el número de fallecidos diarios y fluctua entre los 6000 y los 4000 muertos diarios continuando esta tendencia hasta el mes de Octubre.

Cabe añadir la aclaración de que aquí se representan el número de fallecidos a escala mundial y que dentro de cada país hay diferencias, puede ser que en un país haya disminuido el número de muertes diarias, mientras que en otro haya aumentado. Además, aquí no podemos considerar primera ola y/o segunda ola, dado que en cada país la evolución de la pandemía ha sido un tanto diferente, como hemos podido comprobar anteriormente con cuatro países y sus respectivas curvas.

5. Conclusiones sobre los “Datos del Mundo”.

Conclusiones

En esta primera sección se ha pretendido analizar la Covid-19, a nivel mundial. Como conclusiones, podemos extraer que la pandemia se está (o ya se ha) expandido rapidamente por todo el mundo.

A través de los diferentes gráficos hemos podido comprobar como la pandemía está fuera de control en Estados Unidos, siendo el país líder con más contagios. A este le siguen (a día de hoy), la India, Brasil y Rusia.

Asimismo, como curiosidad cabe destacar qeu el país con menos contagios a día 1/12 (2020) es Vanautu, una isla de Oceania, que presenta tan solo 1 caso.

Por otra parte pretendemos mostrar como ha afectado la pandemia en diferentes países, por ello hemos cogido EEUU, Portugal, Japón y Nigeria y hemos hecho una serie de gráfico, en los cuales podemos los diferentes casos por Covid que hay al día. En el caso de EEUU y Japón se observara dos picos claros.

A diferencia de Nigeria, por ejemplo, donde además de valores más bajos por el momento se puede considerar que ha habido solo “una ola”. En el caso de Portugal, en la segunda ola hay un aumento de los contagios.

Utilizando el paquete Tidycovid19 nos ha permitido mostrar de manera rápida y sencilla el número de casos diarios en diferentes países, donde se confirma que en China los casos eran más abundantes al principio de la pandemia.

De igual modo, con este paquete hemos hecho dos mapas, uno de la variación de las muertes por cada 100 mil habitantes e igual para el número de casos, donde se confirma también lo comentado previamente. (Además, podemos observar que el continente oceánico y africano son los que menos casos y muertes presentan)

Por último, con el fin de mostrar la evolución de los fallecidos hemos hecho un gráfico, en el cual se observa como en marzo la tendencia era alcista, mientras en los meses restantes parece oscilar en las mismas cifras, un nivel alto y preocupante.

(Para ver los casos, muertes y recuperados de manera dinámica podemos ver el [LiveMap])

Live Map

En este apartado se muestra una bola del mundo dinámica. En ella se recoge el número de muertes, fallecidos y recuperados para cada país, como podemos observar.

Los datos provienen del Centro de ciencia e ingeniería de sistemas (JHU CSSE) de la Universidad Johns Hopkins.

Se actualizan cada día y se obtiene rapidamente gracias a la función live.map del paquete: covid19.analytics.


library(covid19.analytics)

library(tidyverse)

data <- covid19.data()
#> ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

data <-data %>%
       select(-c(FIPS,Admin2,Combined_Key)) %>%
       relocate(Lat, .after=Case_Fatality_Ratio) %>%      relocate(Long_, .after=Lat)

6. Estudio sobre los datos de ESPAÑA

6.1 Datos de interés


¿CUÁL FUE LA EVOLUCIÓN DE LOS CONTAGIOS DURANTE LOS 6 PRIMEROS MESES?

#Tabla para poder interpretar el gráfico y consultar más datos

df_mundoE<- df_mundo %>% filter(`Country/Region` == "Spain") %>% select(-c(Recovered, Deaths))

df_mundoEE <- df_mundoE %>% summarise(dif = diff(Confirmed))
dfE <- df_mundoE %>% select(`Country/Region`,Dia, Mes)

df_mundoEsp<- df_mundo %>% filter(`Country/Region` == "Spain") %>% slice(-1)

#Hemos quitados dos de los datos mostrados, ya que distorsionan la gráfica. (Son datos no correctos que contienen valor 0)
Union <- bind_cols(df_mundoEsp, df_mundoEE)
Union <- Union %>% slice(-93)
Union <- Union %>% slice(-115)
Union <- Union %>% slice(-122)
Union <- Union %>% slice(-124)
Union <- Union %>% slice(-50)
Union <- Union %>% mutate(ranking = row_number())

Union <- Union  %>% select(Orden="ranking", Dia, Mes, `Contagios/dia` = "dif", ConfirmadosT="Confirmed", RecuperadosT="Recovered", MuertesT="Deaths")

TABLA RESUMEN

#En la siguiente tabla se muetra para España el número de contagios al día que hubo en tal fecha y el número de contagios, muertes o recuperados acumulados. Hay que poner una nota de págona diciendo que a partir de julio los fines de semana num de contagios/dia sale como 0)

library(reactable)
reactable(Union, defaultPageSize =  10,  paginationType = "jump", showPageSizeOptions =  TRUE , pageSizeOptions =  c ( 10 , 50 , 100 ),defaultColDef = colDef(
    align = "center",
    minWidth = 70,
    headerStyle = list(background = "lightgreen"),
    filterable = TRUE),  highlight = TRUE, outlined = TRUE,
    columns = list(
  `Contagios/dia` = colDef(style = function(value) {
    if (value > 0) {
      color <- "#e00000"}
      else {
      color <- "#008000"
    }
    list(color = color, fontWeight = "bold")
  })))

*Hay que tener en cuenta que a partir de julio los datos en fin de semana tienen un valor de 0, no obstante, deberían obviarse al consultar los datos en la tabla, ya que no resultan coherentes.

A partir de los datos representados en la tabla anteror, hemos hecho el siguiente gráfico, en él se muestra la evolución de los contagios de Covid en España desde enero hasta junio 4

Podemos observar, por tanto, la “curva” de la Primera OLA

#Gráfico de la evolución de los contagios en España des de enero hasta junio. He cogido estos meses, porque a partir de julio, los datos de los fines de semana son 0, por lo que el gráfico que sale no representa realmente el número de contagios.

df_mundoE<- df_mundo %>% filter(`Country/Region` == "Spain") %>% select(-c(Recovered, Deaths))

df_mundoEE <- df_mundoE %>% summarise(dif = diff(Confirmed))
dfE <- df_mundoE %>% select(`Country/Region`,Dia, Mes)

dfE <- dfE %>% slice(-1)
a <- bind_cols(dfE, df_mundoEE)
b <- a %>% filter(Mes %in% c("01", "02", "03", "04", "05", "06"))

b <- b%>% slice(-93) 
b <- b%>% slice(-115)
b <- b %>% slice(-122)
b <- b %>% slice(-124)
b <- b%>% slice(-50)
b <- b %>% mutate(ranking = row_number())

g6 <- ggplot(b, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "Evolución contagios Covid-19", subtitle = "De enero a junio (2020)", caption = "Elaboración propia", x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) + theme(plot.subtitle = element_text(hjust = 0.5))

library(plotly)

Interpretación del gráfico En este se muestra la evolución de los contagios por Covid-19 en España durante los 6 primeros meses,los datos van concretamente desde el 23 de enero hasta el 30 de junio, además se observan 6 colores diferentes, correspondientes a los (6) meses. Esta representado de la siguiente manera: En el eje de las ordenadas se meustra el número de casos al día y en el de las abcisas un “ranking”, este corresponde a la fila de la tabla representada arriba, en la variable “orden”.

Ejemplo: Ranking 59, contagios al día: 3394 y mes 03. Para ver a que día corresponde este valor iriamos a la [Tabla Resumen] y vemos que corresponde con el día 22 (de marzo) Además, obtenemos otros datos como el número de confirmados totales hasta ese día, recuperados o muertes.


Asimismo, cabe hacer una interpretación de los resultados obtenidos de manera que, como podemos observar en el gráfico el aumento en el mes de Marzo es increíble pasando de los 0 casos a cerca de 10000 positivos en un solo día, a raíz de este aumento tan marcado, el gobierno decidió aplicar un conjunto de medidas entre las que estaba el confinamiento domiciliario para toda la población y que como podemos observar tuvo bastante efecto, ya que el número de contagios descendió de manera considerable en Abril. Es cierto, no obstante, que en este mismo mes se dieron diversos picos de contagios pero la tendencia a partir de este mes, Abril, fue la reducción de los casos, acabándose de confirmar con la tendencia en Mayo y en Junio obteniendo valores de contagios muy reducidos en comparación con meses previos.

6.2 Saturación del sistema sanitario español

En este apartado se analizará la evolución de los pacientes ingresados por Covid durante las últimas 24 horas en los meses de septiembre-octubre y noviembre. Así como los dados de alta al día, también durante estos meses.

datos_CCAA <- datos_CCAA %>%
  relocate(Año, .after=Dia) %>%
  relocate(Mes, .after=Dia)

datos_Esp <- datos_CCAA %>%
  filter(cod_ine == 0) %>%
  relocate(cod_ine, .before=Dia)  #Datos para España.

datos_CV <- datos_CCAA %>%
  filter(cod_ine == 10) %>%
  relocate(cod_ine, .before=Dia) #Datos para la Comunitat Valenciana.

datos_Esp_S_N <- datos_Esp %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_CV_S_N<- datos_CV %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_Esp_N <- datos_Esp %>% filter(Mes == "11")

EVOLUCIÓN DE LOS PACIENTES INGRESADOS POR COVID-19

grafico_1 <- ggplot(datos_Esp_S_N , aes(Dia , `Total Pacientes COVID ingresados`, group=Mes, color= Mes))  + geom_line() + labs(title = " Evolución de pacientes ingresados por covid en España", subtitle = "Desde el 1 Septiembre hasta Noviembre 30", caption = "Datos repositorio COVID19")

En el anterior gráfico vemos tres líneas que muestran los datos referentes a los pacientes ingresados por Covid-19 en España en los meses de Septiembre(09) Octubre(10) y Noviembre(11).

Estos meses agrupan lo que ha sido la segunda ola. Dado que observamos un aumento mantenido en Septiembre (del nivel de ingreso hospitalario por Covid), que a mediados de Octubre aumenta de manera muy pronunciada, casi duplicando la que había al principio del mes. En Noviembre, representado por la línea azul, observamos que primeramente los ingresos continúan aumentando, pero a vemos que la tendencia a partir del día 10 empiezan a disminuir, pasando de un máximo de mas de 20000 a menos de 15000 en a penas 15 días. Y situandose a finales de mes, en un nivel más bajo que los ingresados que habían en estos días un mes antes, en octubre.

grafico_a <- ggplot(datos_Esp_N, aes(Dia, `Altas Ult24h`,   fill = Mes )) +  scale_fill_brewer(palette="Spectral") + geom_bar(stat = "identity")+ 
  labs(title = "Número de pacientes dados de alta por COVID en España al día", subtitle = "Mes Noviembre", caption = "Elaboración propia a partir de datos COVID19") + theme(legend.position = "none")


grafico_ap <- grafico_a + 
  geom_text(aes(y=`Altas Ult24h`, 
    label = `Altas Ult24h`), position = position_dodge(width = 0.8), 
    size = 3.2, vjust=3, col = "Black")

Durante el mes de Noviembre vemos que el numero de pacientes dados de alta es bastante elevado, los días que la cifra se reduce coincide con los Domingos de cada mes, dado que estos días, por lo general, el número de altas suele ser menor. Además al venir de una situación de muchos positivos no es de extrañar que el número de altas ronde una cifra de 2000 altas diarias.

#Preparamos los datos para hacer una TABLA
datos_CCAA_S_N <- datos_CCAA %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_CCAA_yaltas <- datos_CCAA_S_N %>% mutate(`%Altas por ingresados`  = (`Altas Ult24h`/ `Total Pacientes COVID ingresados`)* 100)

datos_CCAA_yaltas <- datos_CCAA_yaltas %>% select(Dia, Mes, CCAA, `Total Pacientes COVID ingresados`, `% Camas Ocupadas COVID`, `Total pacientes COVID en UCI`, `%Altas por ingresados`)

6.3 Pruebas realizadas en las CCAA

¿Cuántas PCR’s se han hecho por cada mil habitantes?

Corresponden a los últimos datos disponibles. Asimismo, las Comunidades Autónomas con un mayor tamaño, son aquellas en las que se realizaron más pruebas por cada 100mil habitantes. (Los datos son acumulados)

library(wordcloud2)

dfCCAAp <- dfCCAA %>% select(dia, mes, CCAA, PCR_x_1000hab.) %>% filter(dia == "5") %>% filter(mes == "11") %>% arrange(desc(PCR_x_1000hab.))
dfCCAAp <- dfCCAAp %>% select(CCAA, PCR_x_1000hab.)

wordcloud2(data = dfCCAAp, size = 0.4)

Ahora vamos a verlo mediante gráficos, así podremos ver las PCR’s acumuladas en total y las realizadas para cada 1000habitantes.

PruebasP <- ggplot(dfCCAA, aes(mes, PCR_x_1000hab., fill = CCAA)) + geom_col(position = "dodge")

PCRs <- PruebasP +  facet_wrap(vars(CCAA)) + labs(x = "Mes", y = "Núm. pruebas PCR", title = "PCR's al mes por cada mil hab.", caption = "Datos obtenidos de Datadista")  + theme_bw() + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))
graficoB <- ggplot(dfCCAA, aes(mes, PCR, fill = CCAA)) + geom_col(position = "dodge")

b <- graficoB +  facet_wrap(vars(CCAA)) + labs(x = "Mes", y = "Núm. pruebas PCR", title = "PCR's mensuales") + theme_bw() + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))
#Ahora con el paquete patchwork juntamos los dos gráficos

En este caso hemos ajustadao la escala de x para que coincida en todas las CCAA, por lo que en Ceuta y Melilla no se ven los datos en el gráfico de la izquierda, no porque no haya valores, sino porque las pruebas hechas en estas ciudades autónomas son prácticamente insignificante si se comparan con otras CCAA. En cambio, al poner el número de pruebas por cada mil habitantes, si se observan los datos, ya que hemos cogido un rango menor.

Este conjunto de gráficos nos muestra, por un lado, el número de PCR’s que se han realizado en cada comunidad autónoma en cada mes; y la otra, nos muestra el número de PCR’s por cada mil habitantes.

Si miramos la tabla de la cantidad de PCR’s realizadas, en primer lugar, se observa claramente como la cantidad pruebas realizadas en la “segunda ola” (en los últimos meses del año) es mucho mayor que el número de pruebas realizadas en la primera. Esto se debe a que, en la primera ola, el virus llegó cuando nadie lo esperaba, y la cantidad de recursos estaba muy limitado, es más, el sistema sanitario se colapsó.

También, debemos destacar que el número de pruebas realizadas en las comunidades de Madrid, Cataluña y Andalucía es mayor que las realizadas en el resto de CCAA. Cabe recalcar que la población de dichas comunidades es mucho mayor.

No obstante, si observamos el segundo conjunto de gráficos, la cantidad de pruebas realizadas en relación a la cantidad de habitantes que hay en cada comunidad, se iguala mucho más. En la “primera ola” la cantidad de pruebas están bastante igualadas en la mayoría de CCAA, sin embargo, donde se muestran más diferencias es en la “segunda ola”.

En la “segunda ola” Madrid ya no tiene unos datos tan escandalosos, los datos de Navarra y La Rioja se disparan. Por otro lado, también destacan otras comunidades como Aragón, Cantabria, Cataluña y Asturias. Las Comunidades con menos pruebas realizadas, serían Andalucía (el número de pruebas es altísimo pero comparado con su población es bajo), Valencia o Canarias.

C_M <- dfCCAA %>% filter(CCAA %in% c("Melilla", "Ceuta"))
C_M <- C_M %>% select(dia, mes, año, CCAA, PCR, TEST_ANTICUERPOS)
C_M <- C_M %>% pivot_longer(5:6, names_to = "Prueba", values_to= "N.prueba")

CeuMel <- C_M %>% group_by(CCAA, mes, Prueba) %>% summarise(Total = sum(N.prueba)) %>% filter(Prueba == "PCR") %>% filter(mes != "11")


graficoC_M <- ggplot(CeuMel, aes(mes, Total, fill = CCAA)) + scale_fill_brewer(palette = "Reds") + geom_col(position = "dodge") + labs(x = "Meses", y = "Núm. pruebas PCR", title = "PCR's mensuales Ceuta y Melilla") + theme_bw() + theme(plot.title = element_text(hjust = 0.5))
library(plotly)
ggplotly(graficoC_M)

Si dejaramos las escalas libres para Ceuta y Melilla, vemos como el nivel de PCR’s ha incrementado a lo largo de los meses, de marzo ha octubre hubo un aumento de 55.146 pruebas en Melilla, no obstante, en ambos gráficos estas ciudades autónomas presentan un número de pruebas bajo, cabe decir, no obstante, que el número de habitantes aquí es menor que en otras CCAA, por tanto, resulta lógico que las pruebas realizadas (sin tener en cuenta los datos relativos) sean menores.

6.4 Comparación, pruebas PCR y test anticuerpos

dfb <- dfCCAA %>% select(dia, mes, año, cod_ine, CCAA, PCR, TEST_ANTICUERPOS)

Tpruebasl <- dfb %>% pivot_longer(cols = 6:7, names_to = "Prueba", values_to = "Total")

mediap <- Tpruebasl %>% group_by(Prueba) %>%  summarise(media = mean(Total))


grafico2 <- ggplot(mediap, aes(Prueba, media, fill = Prueba)) +  scale_fill_brewer(palette="Spectral") + geom_col() + labs(y = "Media pruebas",  title = "Comparación: Número de pruebas (totales) medias", caption = "Elaboración propia") + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + geom_text(aes(y=media, label = media), position = position_dodge(width = 0.8), size = 3.2, vjust=3, col = "Black") + xlab(NULL) +  theme_classic() + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))

A la vista del gráfico se comprueba como el número de PCRs es más significativo, se utiliza diariamente más que los tests rápidos, para detectar los positivos en Covid-19.

Una de las causas principales de ello, es porque las PCR’s (‘Reacción en Cadena de la Polimerasa’) son más fiables, permiten detectar y cuantificar el virus. Mientras que el test rápido sirve para detectar si la persona ha estado contagiada, en presencia o no de anticuerpos.

maxP <- dfCCAA %>% select(dia, mes, cod_ine, PCR) %>% filter(mes != "4")
maxp <- maxP %>% slice_max(PCR, n=1) #El dia que más pruebas PCR se hicieron fue el día 5 del 11 en Cataluña, concretamente se hicieron: 2.792.707
maxp <- maxp %>% rename(N.Pruebas = "PCR")
maxp <- maxp %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 2792707 ~ "PCR"))

#Haremos lo mismo para los otros tipos de prueba y para obtener el mínimo, por lo que creemos que el código no es necesario mostrarlo.
#PREPARACIÓN DE LAS TABLAS
#Juntar las tablas.
tabla <- rbind(maxo, maxac,maxp)

#Exporto esta tabla:
rio::export(tabla, here::here("datos", "tablamax.csv"))
tabla <- rio::import(here::here("datos", "tablamax.csv"))

tabla <- tabla %>% mutate(CCAA = case_when(cod_ine == 1 ~"Andalucia",   cod_ine == 9 ~ "Cataluña")) %>% select(dia, mes, CCAA, Tipo_Prueba, N.Pruebas)

#Repetimos todo el proceso para hacer el mínimo
#Paso final para las tablas
library(flextable)

ftmin <- flextable(head(tablamin), col_keys = c("dia", "mes", "CCAA", "Tipo_Prueba", "N.Pruebas"))

ftmax <-  flextable(head(tabla), col_keys = c("dia", "mes", "CCAA", "Tipo_Prueba", "N.Pruebas"))


¿Cuál fue el día en el que menos pruebas se hicieron?

dia

mes

CCAA

Tipo_Prueba

N.Pruebas

2

7

Madrid

OTROS_TESTS

0

14

5

Cataluña

TEST_ANTICUERPOS

1983

14

5

I.Baleares

PCR

649


Y, ¿Cuál fue el día en el que más pruebas se hicieron?

dia

mes

CCAA

Tipo_Prueba

N.Pruebas

5

11

Andalucia

OTROS_TESTS

1048632

5

11

Andalucia

TEST_ANTICUERPOS

490969

5

11

Cataluña

PCR

2792707


*Cabe tener en cuenta que los datos van desde el 23 de marzo hasta el 5 de noviembre.

6.5 Análisis de casos según las provincias

#Preparando los datos para que salga el mapa.
library(rio)
library(tidyverse)


Provincias <- rio::import("https://github.com/perezp44/LAU2boundaries4spain/blob/master/data/Provincias.rda?raw=true")


dfPROV <- dfPROV %>% mutate(Total_x_cap = Totalxcap*100)
dfPROV <- dfPROV %>% select(provincia, Cod, Poblacion, Total, Total_x_cap) %>% arrange(Cod)
#names(Provincias)


library(sf)

canarias <- Provincias %>% filter(INECodProv %in% c(35,38))

peninsula <- Provincias %>% filter( !(INECodProv %in% c(35, 38)))

my_shift <- st_bbox(peninsula)[c(1,2)]- (st_bbox(canarias)[c(1,2)]) + c(-2.4, -1.1)

canarias$geometry <- canarias$geometry + my_shift

st_crs(canarias)  <- st_crs(peninsula)

peninsula_y_canarias <- rbind(peninsula, canarias)



p <- ggplot(texto = "provincia" ) + geom_sf(data = peninsula_y_canarias)


Tabla <- full_join(peninsula_y_canarias, dfPROV, by = c("INECodProv" = "Cod"))


Tabla1 <- Tabla %>% select(provincia, INECodProv, Total_x_cap, geometry)

provincias_point <- st_centroid(Tabla1)
provincias_points <- cbind(Tabla1, st_coordinates(st_centroid(Tabla1$geometry)))


mapa <- p + geom_sf(data = peninsula_y_canarias, fill = NA) +
    geom_sf(data = provincias_points, aes(geometry = geometry, fill = Total_x_cap)) + scale_fill_viridis_c(direction = -1, option = "inferno", name = "Contagios x hab (%)", alpha = .6) + labs(title = "Contagios relativos según provincia y población") + theme(plot.title = element_text(hjust = 0.7, face = "bold", color = "Black")) + geom_text(data = provincias_points, aes(X, y=Y, label = provincia), color = "Black", fontface = "bold", check_overlap = TRUE, size = 2.5) +  theme_minimal() + theme(axis.text.x = element_blank(), axis.text.y = element_blank()) + labs(x = NULL, y=NULL)

Es importante considerar los datos de manera relativa

Provincias con más casos según población

#Teniendo en cuenta la población:

dfTrelp <- dfTrel %>% mutate(Porcentaje = Totalxcap*100)


graficoB <- ggplot(dfTrelp, aes(forcats::fct_reorder(provincia, Porcentaje), Porcentaje)) +
  geom_col(aes(fill = Porcentaje)) +
  theme(axis.text.x = element_text(angle=90, vjust=0.6), panel.background = NULL) +
  scale_fill_viridis_c(option = "inferno", name = "Contagios per capita", alpha = 0.8, begin = 0.3, end = 0.7, direction = -1, guide = guide_colorbar( direction = "horizontal", barheight = unit(2, units = "mm"), barwidth = unit(50, units = "mm"), draw.ulim = F, title.position = 'top', title.hjust = 0.5, label.hjust = 0.5)) +
  theme(legend.text = element_text(size = 7)) +
  labs(title = "Contagios totales según provincia", subtitle = "Y en relación al número de habitantes") +
  theme(plot.title = element_text(hjust = 0.5)) +
  theme(plot.subtitle = element_text(hjust = 0.5)) + labs(x = NULL, y = NULL) + theme(legend.position = "bottom")

Treemapify

Si relacionamos el número de contagios totales por el número de habitantes; vemos que la provincia con más contagios es Navarra, seguida de Huesca y Burgos. Madrid sigue siendo una de las provincias cabeceras en cuanto a contagios. Al contrario, las provincias que más destacan por menor número de casos son las provincias canarias Tenerife y Las Palmas.

library(treemapify)

ggplot(dfTrelp, aes(area = Porcentaje, fill = Porcentaje, label = provincia)) +
  geom_treemap() +
  geom_treemap_text(fontface = "italic", colour = "white", place = "centre",
                    grow = FALSE) +
  scale_fill_viridis_c(option = "inferno", name = "", alpha = 0.8, begin = 0.3, end = 0.7, direction = -1,
                       guide = guide_colorbar( title = "% casos según población", direction = "horizontal", barheight = unit(2, units = "mm"),
                                               barwidth = unit(50, units = "mm"), draw.ulim = F,
                                               title.position = 'top', title.hjust = 0.5, label.hjust = 0.5)) +
  theme(legend.position = "bottom") + scale_x_continuous(labels=function(n){format(n, scientific = FALSE)}) +
  labs(title = "Provincias con mayor número de casos según su población (en %)",
       subtitle = "Se ha calculado el Total de casos entre la pobación y multiplicado por 100 para sacar el porcentaje",
       caption = "Los últimos datos corresponden al 11-11-2020") + theme(plot.title = element_text(hjust = 0.5)) +
  theme(plot.subtitle = element_text(hjust = 0.5))

Una comparación

Dado que es importante tener en cuenta los casos de manera relativa, aquí hemos querido comparar el número de provincias con más casos teniendo en cuenta el número de habitantes que hay en cada una de estas y sin tener en cuenta la población. Como era esperable y a la vista del gráfico, observamos que resultados difieren al considerar o no la población


dfM <- dfTrel %>% select(provincia, Total) %>% arrange(desc(Total))

dfM <- dfM %>% filter(provincia %in% c("Madrid", "Barcelona", "Murcia", "Sevilla", "Zaragoza"))

graficoA <- ggplot(dfM, aes(forcats::fct_reorder(provincia, Total), Total)) +
  geom_col(aes(fill = Total)) +
  theme(panel.background = NULL) +
  scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})

graficoA <- graficoA + geom_text(aes(y=Total, label = Total), position = position_dodge(width = 0.9), size = 3.2, vjust=2, col = "White") + labs(x = NULL, y = NULL, title = "5 provincias con más contagios totales") + theme(plot.title = element_text(hjust = 0.5))

dfMb <- dfTrel %>% select(provincia, Totalxcap) %>% arrange(desc(Totalxcap))

dfMb <- dfMb %>% filter(provincia %in% c("Navarra", "Huesca", "Burgos", "Valladolid", "Zaragoza"))

graficoA2 <- ggplot(dfMb, aes(forcats::fct_reorder(provincia, Totalxcap), Totalxcap)) +
  geom_col(aes(fill = Totalxcap)) +
  theme(panel.background = NULL) +
  scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})

graficoA2 <- graficoA2 + geom_text(aes(y=Totalxcap, label = Totalxcap), position = position_dodge(width = 0.3), size = 2, vjust=3, col = "White") + labs(x = NULL, y = NULL, title = "5 provincias con más contagios en función de la población") + theme(plot.title = element_text(hjust = 0.5))

7. Estudio sobre el Covid en la Comunidad Valenciana

Siguiendo nuestro análisis sobre la Covid-19, en este apartado nos centraremos en analizar algunos elementos destaclabes de la pandemía en la Comunidad Valenciana.

7.1 Contagios en la Comunidad Valenciana.


dfrelb <- dfgg %>% mutate(Total_cap = (Num/Poblacion))

dfTrelx <- dfrelb %>% mutate(Totalxcap = (Total_cap*100)) %>% filter(provincia %in% c("Castellon", "Valencia", "Alicante"))

dfTrelx <- transform(dfTrelx, mes = as.numeric(mes))

a <- ggplot(data = dfTrelx, aes(mes, Num, group=provincia, color = provincia)) + geom_line() + geom_point() + theme_minimal()   + labs(y= "Número de contagios", y = "Meses", caption = "Elaboración propia") + theme(plot.title = element_text(hjust = 0.5)) + scale_x_continuous(breaks = seq(1, 11, 1))

a + transition_reveal(mes) + labs(title="NÚMERO DE CASOS EN LA COMUNIDAD VALENCIANA. Mes: {as.integer(frame_along)}")

Centrándonos en las provincias de la Comunidad Valenciana, se puede observar que Alicante es la que menos Contagios tiene de las tres, luego iría Castellón y Valencia. Pero las tres, tienen una buena tasa de contagios respecto al resto de provincias, ya que están entre las 11 provincias con menos contagios de toda España.

7.2 Ingresados en Sept-Oct-Nov por Covid.

datos_CV <- datos_CCAA %>%
filter(cod_ine == 10) %>%
relocate(cod_ine, .before=Dia) #Datos para la Comunitat Valenciana.
datos_CV_S_N<- datos_CV %>% filter (Mes == "09"| Mes == "10"| Mes == "11")
grafico_CV <- ggplot(datos_CV_S_N , aes(Dia , `Total Pacientes COVID ingresados`, group=Mes, color= Mes))  + geom_line() + labs(title = " Evolución de pacientes ingresados por covid en la Comunidad Valenciana", subtitle = "Desde el 1 Septiembre hasta Noviembre 30", caption = "Datos repositorio COVID19")
grafico_CV

La evolución de los pacientes ingresados por COVID en la segunda ola, han evolucionado de manera similar a la evolución de contagios.

Podemos ver, como en septiembre el número de pacientes estaba bastante controlado, pero cuando llegó el mes de octubre, fue cuando los hospitales sufrieron un repunte total de los pacientes ingresados, que durante el mes de noviembre aumentó todavía más si cabe.

En noviembre los datos se volvieron altamente peligrosos, ya que los hospitales de la Comunidad estaban cerca de colapsarse como ya sucedió en la primera ola.

La cresta de esta ola, llegó el 18 de noviembre donde habían más de 1800 ingresados por coronavirus en la Comunidad Valenciana.

Pruebas realizadas

Tipos de pruebas


La prueba más repetida en nuestra comunidad es sin ninguna duda, la prueba PCR, seguida de la prueba de anticuerpos. En todos los meses recogidos, la cantidad de pruebas PCR es muy superior a la cantidad del resto de pruebas.

También podemos ver, que el en el mes de septiembre se han realizado más pruebas que en los meses de julio y agosto. Cabe destacar que, en el mes de julio, se realizaron más pruebas de anticuerpos que en el resto de los meses.

Por último, se ve una clara evolución al alza de otros tests, esto se da gracias a que la prueba de antígenos cada vez es más común debido a su eficacia y a que la realización de ella es mucho más barata que las PCR.

cv <- dfp %>% filter(CCAA == "Comunidad Valenciana")
cv  <- cv %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes)


cv <- cv %>% filter (mes == "07"| mes == "08"| mes == "09") %>% select(dia, mes, PCR, TEST_ANTICUERPOS, OTROS_TESTS)

cvl <- cv %>% pivot_longer(3:5, names_to = "Pruebas", values_to = "N.prueba")

#Para calcular en la Comunidad Valenciana que tipo de pruebas se han hecho más durante los meses de julio, agosto y septiembre.

Csep <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "09")

S <- ggplot(Csep, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="septiembre") + theme(plot.title = element_text(hjust = 0.5))
#Igual para julio y agosto

Cjul <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "07")

J <- ggplot(Cjul, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="julio") + theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "none")

Cagost <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "08")

A <- ggplot(Cagost, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="agosto") + theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "none")

PCR’s según mes


C_V <- dfCCAA %>% filter(CCAA == "C.Valenciana")
C_V <- C_V %>% select(dia, mes, año, CCAA, PCR, TEST_ANTICUERPOS)
C_V <- C_V %>% pivot_longer(5:6, names_to = "Prueba", values_to= "N.prueba")

CVlcna <- C_V %>% group_by(mes, Prueba) %>% summarise(Total = sum(N.prueba)) %>% filter(Prueba == "PCR") %>% filter(mes != "11")

graficoC_V <- ggplot(CVlcna, aes(mes, Total, fill = "Orange"))  + geom_col(position = "dodge") + labs(x = "Meses", y = "Núm. pruebas PCR", title = "PCR's mensuales C.Valenciana", subtitle =  "Meses abril-octubre") + theme_bw() + theme(plot.title = element_text(hjust = 0.5)) + theme(plot.subtitle = element_text(hjust = 0.5)) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})

En este gráfico se muestran las PCR’s acumuladas

La evolución mensual de PCR’s en la Comunidad Valenciana, demuestra que la cantidad de pruebas realizadas en la segunda ola, es mucho mayor que en la primera; esto se debe a que en la primera ola estábamos escasos de recursos.

#Hemos hecho este gráfico pero no sale cuando le damos a Knit.
library(highcharter)

C_vf <- C_V %>% filter(mes != "11") %>% filter(mes != "4")  %>% group_by(mes, Prueba) %>% summarise(Total = sum(N.prueba))

hchart(C_vf, "column", hcaes(x = mes, y = Total, group = Prueba))  %>%  hc_add_theme(hc_theme_gridlight())  %>%   hc_title(
    text = "<b>NÚMERO DE PRUEBAS SEGÚN TESTS Y MESES EN LA COMUNIDAD VALENCIANA </b>",
    margin = 20,
    align = "center",
    style = list(color = "#22A884"))

#*Los valores de este gráfico son la suma total de las pruebas realizadas en un mes concreto, los datos ofrecidos mostraban las pruebas realizadas por semanas durante cada mes.

8. Algunas cuestiones sobre el impacto económico

¿Qué cuestiones?

Por último, en este apartado nos gustaría comentar cual ha sido el efecto de la Covid-19, en algunos ámbitos económicos, en concreto, como ha afectado al mercado de trabajo, al desempleo, en diferentes países europeos. Además de algunas cuestiones sobre el PIB, el cual, como era de esperar ha bajado ddebido a la actual crisis sanitaria.

Para mostrar esto, hemos cogido datos del Eurostat. Este BREVE análisis se dividirá en:

  • Primeramente un mapa con el % de parados que había en los diferentes países de la Unión Europea, durante el mes de abril, en plena pandemia (y confinamineto de muchos de estos países)

  • Seguidamente compararemos en los diferentes meses como ha evolucionado el paro en 5 países europeos, estos son: Francia, Portugal, Italia, España y como curiosidad, Suecia, ya que es el único país europeo en el que no habido un confinamiento estricto.

  • Por último, centrados en España, podremos observar como el paro ha afectado ha afectado de manera diferente dependiendo del género. Presentando un % de paro mayor las muejeres que los hombres.

En cuanto al PIB, considerando el año base en 2015, pretendemos ver el efecto para Francia, Italia, España y Suecia del:

  • PIB a precios de mercado.
  • Exportaciones de bienes y servicios.
  • Importaciones de bienes y servicios.

DESEMPLEO

Con el fin de analizar la situación del mercado laboral tras la crisi del Covid, hemos hecho una serie de mapas-gráficos.

A través del mapa, observamos que en el mes de Abril la tasa armonizada de paro en España se situaba en valores entre 14,3-16,4. Cifras solo superadas por Grecia.

No obstante, cabe destacar que esto no es una situación nueva, es decir, las cifras de paro en España ya eran elevadas antes de la pandemia, al igual que en Grecia, Por lo tanto, no observamos a corto plazo cambios muy significativos entre la proporción de la población ocupada y la desocupada (Población Activa)

En el siguiente gráfico se muestra la evolución de la tasa de paro armonizada para 5 países (España, Francia, Italia, Portugal y Suecia)

Como vemos, la tendencia aunque no muy pronunciada es clara, a excepción de Italia. Aquí primero parece disminuir la tasa de paro y a partir de abril cambia de tendencia y empieza a aumentar.

En cambio, los demás países analizados y sobretodo en España la tasa de paro aumenta tras la crisis sanitaria. Pasando, por ejemplo, en España de 13,7% en diciembre de 2019 a 16,2% en noviembre de 2020, pasando por un máximo de 16,9% en julio.

En el último gráfico se muestra como ha afectado en España la tasa de paro en función del género, donde podemos concluir que hay más % de mujeres desempleadas que de hombres.

Finalmente, decir que esta crisis no ha afectado de igual manera que la recesión de 2008, además de que muchas empresas han tenido que aplicar el ERTE a sus trabajadores y el gobierno ha tenido que adoptar nuevas medidas en torno a esto. 5

#PREPARANDO LOS DATOS
paro <- search_eurostat(pattern = "unemployment",
                             type = "table")

#Hay datos hasta 2020M11, es decir, hasta el mes de noviembre de este año, 2020.

inf_paro <- get_eurostat(id= "teilm020",  time_format = "num")

labelE <- label_eurostat(inf_paro)

country_codes <- unique(mapdata_0$NUTS_ID)

#2020.25 corresponde al año 2020 mes 04 (abril)
inf_paro_2020 <- inf_paro %>%
  filter( time == "2020.25") %>%
  filter(geo %in% country_codes)

inf_paro_2020_mapa <- mapdata_0 %>%
  right_join(inf_paro_2020) %>%
  mutate(cat = cut_to_classes(values, n=8, decimals = 1))

Mapa de coropletas para el paro

#CODIGO PARA EL MAPA

ggplot(inf_paro_2020_mapa, aes(fill=cat)) +
  geom_sf(color = alpha("white", 1/2), alpha= .9) +
  xlim(c(-20, 44)) +
  ylim(c(35, 70)) +
  labs(title = "Tasa armonizada de paro (%)",
       subtitle = "Abril 2020",
       caption = "(C) EuroGeographics for the administrative boundaries",
       fill= "") +
  theme_classic() +
  theme(
    axis.line = element_blank(),
    axis.text = element_blank(),
    axis.title = element_blank(),
    axis.ticks = element_blank(),
    plot.background = element_rect(fill = "snow", color = NA),
    panel.background = element_rect(fill= "snow", color = NA),
    plot.title = element_text(size = 18, hjust = 0.5),
    plot.subtitle = element_text(size = 12, hjust = 0.5),
    plot.caption = element_text(size = 8, hjust = 1),
    legend.title = element_text(color = "grey40", size = 8),
    legend.text = element_text(color = "grey40", size = 7, hjust = 0),
    legend.position = c(0.93, 0.6),
    plot.margin = unit(c(0.5,2,0.5,1), "cm")) +
  scale_fill_brewer(palette= "Paired")

Evolución del paro

#PREPARANDO LOS DATOS
#La tasa de paro de España en el mes de abril fue del 15%

#En cambio, en el mes de enero, antes de comenzar la pandemia era de 13.5

#Filtramos para comparar España, Francia, Italia, Portugal y Suiza

Filtros <- inf_paro %>% filter(geo %in% c("ES", "PT", "IT", "FR", "SE"))
Filtros <- Filtros %>% filter(sex == "T")

library(plotly)

Evparo <- ggplot(Filtros, aes(time, values, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (en %)", title = "Evolución de la tasa de paro armonizada (en %)",
subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde diciembre 2019 hasta octubre 2020.
(Cada punto del gráfico indica un mes)") +
theme_light() +
theme(plot.title = element_text(size = 18, hjust = 0.5),
plot.subtitle = element_text(size = 12, hjust = 0.5),
plot.caption = element_text(size = 8, hjust = 1)) +
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank())

Evparo <- Evparo + scale_y_continuous(breaks = seq(2, 17, 1))

Paro en España, a qué genero ha afectado más?

#Como ha afectado el paro dependiendo del sexo?

Spain <- inf_paro %>% filter(geo == "ES")
Spain <- Spain %>% filter(sex %in% c("M", "F"))


GraficoSpain <- ggplot(Spain, aes(time, values, color = sex)) +
  geom_line(size = 1) +
  geom_point() +
  labs(y = "Valor (en %)",
       title = "Evolución tasa de paro armonizada para España (en %)",
 subtitle = "Diferenciando por sexo: femenino y masculino", caption ="Datos Eurostat.
Los datos van desde diciembre 2019 hasta octubre 2020.
(Cada punto del gráfico indica un mes)") +
  theme_minimal() +
  theme(plot.title = element_text(size = 18, hjust = 0.5),
        plot.subtitle = element_text(size = 12, hjust = 0.5),
        plot.caption = element_text(size = 8, hjust = 1)) +
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank()) +
  theme(legend.position = "bottom") +
 theme(legend.direction = "horizontal")

PIB

#Datos del paquete Eurostat:
library(tidyverse)

library(eurostat)

gdp <- get_eurostat("namq_10_gdp", time_format = "raw", keepFlags = TRUE)

labelgdp <- label_eurostat(gdp, fix_duplicated = TRUE)
df_names <- names(gdp)

df <- label_eurostat(gdp, code = df_names, fix_duplicated = TRUE)

df <- df %>%
    select(unit_code, s_adj_code, na_item_code, geo, geo_code, time, values)

#df_bb <- pjpv2020.01::pjp_f_unique_values(df, truncate = TRUE, nn_truncate = 200)

df <- df %>% filter(time >= "2018Q1")
gdp <- df


gdp<- gdp %>% rename (unidad_de_medida =na_item_code)

# a) Gross domestic product at market prices
gdp_a <-  gdp  %>% filter(unidad_de_medida== "B1GQ") %>% select(-unidad_de_medida)

gdp_a <- gdp_a %>% filter(unit_code == "CLV_I15") %>% filter(s_adj_code == "SCA")

gdp_a <- gdp_a %>% select(-c(unit_code,s_adj_code))
#Lo mismo para las exportaciones y las importaciones
library(plotly)

Evgdpa <- ggplot(gdp_pa, aes(time, values,group=geo, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (Índices)", title = "Evolución del PIB a precios de mercado (Año base 2015)",
                                                                                                      subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde el primer trimestre de 2018 hasta el tercer trimestre del 2020.
(Cada punto del gráfico indica un trimestre)") +
    theme_light() +
    theme(plot.title = element_text(size = 18, hjust = 0.5),
          plot.subtitle = element_text(size = 12, hjust = 0.5),
          plot.caption = element_text(size = 8, hjust = 1)) +
    theme(axis.title.x=element_blank(),
          axis.text.x=element_blank())


#ggplotly(Evgdpa, tooltip = c("geo", "values"))


En estos tres gráficos queremos ofrecer una perspectiva económica de cuál ha sido el impacto del coronavirus en cuatro países europeos, algunos de los cuales ofrecen diferencias destacables en cuanto a su estructura o composición económica De manera que en estos gráficos se muestra tanto la evolución del PIB a precios de mercado como las exportaciones e importaciones de bienes y servicios, todos ellos en números índices, cuyo año base es 2015 (2015 = 100)

Observando de forma global en los tres gráficos podemos ver que tanto Francia, España e Italia tienen una evolución muy parecida. En cambio, Suecia no sufre tan drásticamente los efectos negativos de la pandemia.

Esto se debe, en parte, a que Suecia no puso un confinamiento restrictivo, durante el primer pico de la pandemia, dado que la incidencia fue mucho menor que en los otros tres países analizados. Optó pues, por la estrategia de ’inmunidad de rebaño" Como resultado, observamos que las cifras de Suecia con mejores que la de otros países de la eurozona, el PIB no cayó tanto en el segundo y tercer trimestre de 2020, se encontraba alrededor de 105 pp. Mientras que en España bajó 15 puntos respecto a su año base.

Además, cabe decir que en el país escandinavo, la digitalización y el teletrabajo ya estaba presente en muchas empresas, a diferencia de otros países, como España, que pilló más de improvisto.

No obstante, sería interesante saber lo que proponen las diferentes autoridades responsables de la política económica para intentar devolver los actuales valores a las cifras que había antes del primer trimestre de 2020. Así como el efecto que tendrá la aplicación de la vacuna sobre las expectativas de la población.

9. Conclusión

El contar con una herramienta tan potente como es R, que nos permite manejar datos y utilizarlos para hacer análisis complejos nos ha permitido y facilitado tener una perspectiva más amplia y a la vez concreta de lo que está sucediendo con la actual pandemia de la Covid-19. Por lo que nuestro análisis se ha centrado en esta, tanto a nivel mundial como más concretamente para España y la Comunidad Valenciana. Así como hemos mostrado de manera breve cual ha sido el impacto económico que ha podido tener la pandemia a nivel europeo.

Cabe señalar que nos ha resultado muy interesante el hecho de poner manejar los datos a nuestro antojo para intentar resolver ciertas cuestiones que nos planteamos antes de empezar el análisis y así, ofrecer la información de forma más visual a través de gráficos, tablas, mapas y demás. Para obtener estos resultados, hemos tenido que seguir varios pasos, empezando por buscar los datos y hacerlos “tidy” (para utilizar aquello que realmente necesitábamos) Además, decir que existen diferentes paquetes (Covid19, TidyCovid19, ncov19…) que recopilan información sobre el Coronavirus y facilitan la creación de, por ejemplo, mapas.

Como indicamos en la introducción, elegimos el tema de la Covid-19 dado que queríamos entender por nuestro pie que era esto que había, prácticamente, paralizado el mundo. Por ello, en el presente informe hemos intentado mostrar curiosidades y datos, con el fin de tener una visión general de cómo ha sido el devenir de la pandemia y su evolución hasta prácticamente el mes de Diciembre.

Por último, cabe comentar algunas cuestiones extraídas tras hacer el análisis. Así pues, es destacable que la segunda ola a nivel de contagios ha sido mucho mayor que la primera ola en la mayoría de países, todo y que gracias a la previa preparación, la saturación del sistema sanitario no ha llegado al nivel de la primera, donde hubo momentos en los que los hospitales parecían estar al borde del colapso.

Asimismo, dado que creemos que para poder comparar los datos es mejor que sean relativos, para el caso de España hemos cogido la población de las provincias y así hemos podido calcular el % de contagios según la población. Además de, por ejemplo, las PCR’s por cada 100 mil habitantes, en las diferentes Comunidades Autónomas, donde destaca Navarra como la que más pruebas ha realizado.

Finalmente decir que al tratarse de un tema actual los datos van evolucionando, cambiando. Por tanto, hay que fijarse en el periodo para el que está hecha cada una de las representaciones.

Referencias

Las siguientes páginas web son las que hemos utilizado para la realización del trabajo:

Además de las páginas web mencionadas, hemos utilizado los tutoriales y slides del curso (link mencionado en: nota de página 1)

Asimismo, como comeNtabamos en la introducción nos hemos inspirado para hacer el presente trabajo en nuestro interés por investigar sobre este tema, el cual es actual, así como por la cantidad de datos y notícias que se transmiten día a día.

Igualmente, para hacer el informe y tener ejemplos (referencias) hemos acudido a los trabajos realizados por los compañeros que cursaron la asignatura el año pasado, los encontramos aquí: https://github.com/perezp44/tutoriales_intro_DS



Para acabar este chunk incluiremos la session info:

sessioninfo::session_info() %>% details::details(summary = 'current session info') 

current session info


- Session info ---------------------------------------------------------------
 setting  value                       
 version  R version 4.0.2 (2020-06-22)
 os       Windows 10 x64              
 system   x86_64, mingw32             
 ui       RTerm                       
 language (EN)                        
 collate  Spanish_Spain.1252          
 ctype    Spanish_Spain.1252          
 tz       Europe/Paris                
 date     2020-12-17                  

- Packages -------------------------------------------------------------------
 package           * version    date       lib
 ape                 5.4-1      2020-08-13 [1]
 assertthat          0.2.1      2019-03-21 [1]
 backports           1.2.0      2020-11-02 [1]
 base64enc           0.1-3      2015-07-28 [1]
 bibtex              0.4.2.2    2020-01-02 [1]
 bitops              1.0-6      2013-08-17 [1]
 blob                1.2.1      2020-01-20 [1]
 broom               0.7.0      2020-07-09 [1]
 Cairo             * 1.5-12.2   2020-07-07 [1]
 caTools             1.18.0     2020-01-17 [1]
 cellranger          1.1.0      2016-07-27 [1]
 checkmate           2.0.0      2020-02-06 [1]
 class               7.3-17     2020-04-26 [2]
 classInt            0.4-3      2020-04-07 [1]
 cli                 2.2.0      2020-11-20 [1]
 clipr               0.7.1      2020-10-08 [1]
 collapsibleTree     0.1.7      2018-08-22 [1]
 colorspace          2.0-0      2020-11-11 [1]
 commonmark          1.7        2018-12-01 [1]
 countrycode         1.2.0      2020-05-22 [1]
 covdata           * 0.5.95     2020-12-05 [1]
 covid19.analytics * 2.0        2020-09-28 [1]
 cpp11               0.2.4      2020-11-05 [1]
 crayon              1.3.4      2017-09-16 [1]
 crosstalk           1.1.0.1    2020-03-13 [1]
 curl                4.3        2019-12-02 [1]
 data.table          1.13.0     2020-07-24 [1]
 data.tree           1.0.0      2020-08-03 [1]
 DBI                 1.1.0      2019-12-15 [1]
 dbplyr              1.4.4      2020-05-27 [1]
 desc                1.2.0      2018-05-01 [1]
 deSolve             1.28       2020-03-08 [1]
 details             0.2.1      2020-01-12 [1]
 digest              0.6.27     2020-10-24 [1]
 dplyr             * 1.0.2      2020-08-18 [1]
 DT                  0.16       2020-10-13 [1]
 e1071               1.7-4      2020-10-14 [1]
 ellipsis            0.3.1      2020-05-15 [1]
 eurostat          * 3.6.84     2020-11-19 [1]
 evaluate            0.14       2019-05-28 [1]
 fansi               0.4.1      2020-01-08 [1]
 farver              2.0.3      2020-01-16 [1]
 fastmap             1.0.1      2019-10-08 [1]
 flextable         * 0.5.11     2020-09-09 [1]
 forcats           * 0.5.0      2020-03-01 [1]
 foreign             0.8-80     2020-05-24 [2]
 formatR             1.7        2019-06-11 [1]
 fs                  1.5.0      2020-07-31 [1]
 gdtools             0.2.2      2020-04-03 [1]
 generics            0.1.0      2020-10-31 [1]
 gganimate         * 1.0.7      2020-10-15 [1]
 ggfittext           0.9.0      2020-06-14 [1]
 ggplot2           * 3.3.2      2020-06-19 [1]
 ggrepel             0.8.2      2020-03-08 [1]
 ggThemeAssist     * 0.1.5      2016-08-13 [1]
 gifski            * 0.8.6      2018-09-28 [1]
 glue                1.4.2      2020-08-27 [1]
 gplots              3.1.0      2020-09-18 [1]
 gridExtra         * 2.3        2017-09-09 [1]
 gt                * 0.2.2      2020-11-20 [1]
 gtable              0.3.0      2019-03-25 [1]
 gtools              3.8.2      2020-03-31 [1]
 haven               2.3.1      2020-06-01 [1]
 here                1.0.0      2020-11-15 [1]
 hms                 0.5.3      2020-01-08 [1]
 htmltools           0.5.0      2020-06-16 [1]
 htmlwidgets         1.5.2      2020-10-03 [1]
 httpuv              1.5.4      2020-06-06 [1]
 httr                1.4.2      2020-07-20 [1]
 jsonlite            1.7.1      2020-09-07 [1]
 KernSmooth          2.23-17    2020-04-26 [2]
 klippy            * 0.0.0.9500 2020-11-14 [1]
 knitr             * 1.30       2020-09-22 [1]
 labeling            0.4.2      2020-10-20 [1]
 later               1.1.0.1    2020-06-05 [1]
 lattice             0.20-41    2020-04-02 [2]
 lazyeval            0.2.2      2019-03-15 [1]
 lifecycle           0.2.0      2020-03-06 [1]
 lubridate         * 1.7.9.2    2020-11-13 [1]
 magrittr            2.0.1      2020-11-17 [1]
 mime                0.9        2020-02-04 [1]
 miniUI              0.1.1.1    2018-05-18 [1]
 modelr              0.1.8      2020-05-19 [1]
 munsell             0.5.0      2018-06-12 [1]
 nlme                3.1-148    2020-05-24 [2]
 officer             0.3.14     2020-09-07 [1]
 openxlsx            4.2.2      2020-09-17 [1]
 patchwork         * 1.1.0      2020-11-09 [1]
 pheatmap            1.0.12     2019-01-04 [1]
 pillar              1.4.7      2020-11-20 [1]
 pkgconfig           2.0.3      2019-09-22 [1]
 plotly            * 4.9.2.1    2020-04-04 [1]
 plyr                1.8.6      2020-03-03 [1]
 png                 0.1-7      2013-12-03 [1]
 prettyunits         1.1.1      2020-01-24 [1]
 progress            1.2.2      2019-05-16 [1]
 promises            1.1.1      2020-06-09 [1]
 purrr             * 0.3.4      2020-04-17 [1]
 R6                  2.5.0      2020-10-28 [1]
 rclipboard          0.1.2      2019-07-02 [1]
 RColorBrewer      * 1.1-2      2014-12-07 [1]
 Rcpp                1.0.5      2020-07-06 [1]
 reactable         * 0.2.3      2020-10-04 [1]
 reactR              0.4.3      2020-07-12 [1]
 readr             * 1.4.0      2020-10-05 [1]
 readxl              1.3.1      2019-03-13 [1]
 RefManageR          1.2.12     2019-04-03 [1]
 rentrez             1.2.3      2020-11-10 [1]
 reprex              0.3.0      2019-05-16 [1]
 rio               * 0.5.16     2018-11-26 [1]
 rlang               0.4.9      2020-11-26 [1]
 rmarkdown           2.5        2020-10-21 [1]
 rprojroot           2.0.2      2020-11-15 [1]
 rstudioapi          0.13       2020-11-12 [1]
 rvest               0.3.6      2020-07-25 [1]
 sass                0.2.0      2020-03-18 [1]
 scales              1.1.1      2020-05-11 [1]
 sessioninfo         1.1.1      2018-11-05 [1]
 sf                * 0.9-6      2020-09-13 [1]
 shiny               1.5.0      2020-06-23 [1]
 shinycssloaders     1.0.0      2020-07-28 [1]
 shinydashboard      0.7.1      2018-10-17 [1]
 shinyjs             2.0.0      2020-09-09 [1]
 shinyWidgets        0.5.4      2020-10-06 [1]
 sp                  1.4-2      2020-05-20 [1]
 stringi             1.5.3      2020-09-09 [1]
 stringr           * 1.4.0      2019-02-10 [1]
 systemfonts         0.3.1      2020-09-08 [1]
 tibble            * 3.0.4      2020-10-12 [1]
 tidycovid19       * 0.0.0.9000 2020-12-11 [1]
 tidyr             * 1.1.2      2020-08-27 [1]
 tidyselect          1.1.0      2020-05-11 [1]
 tidyverse         * 1.3.0      2019-11-21 [1]
 treemapify        * 2.5.4      2020-11-19 [1]
 tweenr              1.0.1      2018-12-14 [1]
 units               0.6-7      2020-06-13 [1]
 uuid                0.1-4      2020-02-26 [1]
 vctrs               0.3.5      2020-11-17 [1]
 viridisLite         0.3.0      2018-02-01 [1]
 withr               2.3.0      2020-09-22 [1]
 wordcloud2        * 0.2.1      2018-01-03 [1]
 xfun                0.19       2020-10-30 [1]
 XML                 3.99-0.5   2020-07-23 [1]
 xml2                1.3.2      2020-04-23 [1]
 xtable              1.8-4      2019-04-21 [1]
 yaml                2.2.1      2020-02-01 [1]
 zip                 2.1.1      2020-08-27 [1]
 source                                     
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.0)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 Github (kjhealy/covdata@719f554)           
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 Github (rstudio/gt@416ca71)                
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 Github (rlesur/klippy@378c247)             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.0)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.0)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 Github (joachim-gassen/tidycovid19@8006632)
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.0)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.3)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             
 CRAN (R 4.0.2)                             

[1] C:/Users/noeli/OneDrive/Documentos/R/win-library/4.0
[2] C:/Program Files/R/R-4.0.2/library



  1. Si quieres visitar la web del curso: https://perezp44.github.io/intro-ds-20-21-web/↩︎

  2. Si quieres consultar más información haz click aquí↩︎

  3. Indicamos el enlace por si se quiere obtener más información al respecto.https://data.humdata.org/dataset/acaps-covid19-government-measures-dataset↩︎

  4. No hemos hecho la evolución hasta la fecha actual, dado que a partir de julio los datos de contagios en fines de semana muestran unos valores de 0 (Un resultado no coherente)↩︎

  5. Aquí dejamos en elance por si se quiere consultar más inf. SEPE↩︎

---
title: <center><FONT COLOR="FF4D00">ANÁLISIS SOBRE LA COVID-19</FONT></center>
author: "Miembros del grupo:  \n\n **Ignacio Montava** (monpeig@alumni.uv.es), \n\n **Andreu Esparza** (anesimar@alumni.uv.es) y \n\n **Noelia Sánchez** (nosan5@alumni.uv.es) \n\n Universitat de València"
date: "Diciembre de 2020 (actualizado el `r format(Sys.time(), '%d-%m-%Y')`)"
output:
  html_document: 
    self_contained: yes
    code_download: true
    code_folding: show
    theme: united
    highlight: pygments
    toc: yes
    toc_float:
      collapsed: yes
      smooth_scroll: yes
    df_print: kable
editor_options: 
  chunk_output_type: console
---

```{r packages-setup, include = FALSE}
library(tidyverse)
# remotes::install_github("rlesur/klippy")
library(klippy) 
library(knitr)
```


```{r chunk-setup, include = FALSE}
knitr::opts_chunk$set(echo = TRUE, eval = TRUE, message = FALSE, warning = FALSE, 
                      #results = "hold",
                      cache = FALSE, cache.path = "/caches/", comment = "#>",
                      #fig.width = 7, #fig.height= 7,   
                      #out.width = 7, out.height = 7,
                      collapse = TRUE,  fig.show = "hold",
                      fig.asp = 7/9, out.width = "60%", fig.align = "center")
#- para mejorar los gráficos, bueno en realidad para que se vean igual en distintos SO
#- https://www.jumpingrivers.com/blog/r-knitr-markdown-png-pdf-graphics/
knitr::opts_chunk$set(dev = "png", dev.args = list(type = "cairo-png"))
```

```{r options-setup, include = FALSE}
options(scipen = 999) #- para quitar la notación científica
options("yaml.eval.expr" = TRUE) #- https://github.com/viking/r-yaml/issues/47  (lo puse x el pb con el warning) En realidad creo que mejor sería ponerlo en RProfile
```


```{r klippy, echo = FALSE}
klippy::klippy(position = c("top", "right")) #- remotes::install_github("rlesur/klippy")
```

<div style="text-align: justify"><div/>
-----------------

Trabajo  elaborado para la asignatura "Programación y manejo de datos en la era del Big Data" de la Universitat de València durante el curso 2020-2021. La página web de la asignatura puede verse aquí: <https://perezp44.github.io/intro-ds-20-21-web/>. Los trabajos de mis compañeros de curso pueden verse [aquí](https://perezp44.github.io/intro-ds-20-21-web/07-trabajos.html)

---------------

## 1. Introducción 


En la asignatura de "Programación y manejo de datos en la era del Big Data" [^1] tenemos que hacer un trabajo de tema libre, por lo que nos parecia interesante hacerlo de un tema que nos afecta a todos, como es **la evolución de la pandemia de la Covid-19** 

Por ello, hemos buscado diferentes conjuntos de datos con los que poder hacer el análisis. Y así, mostrar de una forma más visual y sencilla diferentes cuestiones que nos pueden surgir al pensar en la Covid-19. Como por ejemplo, que incidencia de contagios ha habido dependiendo de la província o CCAA, donde se han hecho más pruebas pcr o test de ac o que paises han controlado mejor o peor la pandemía, entre otras cuestioenes. 

## 2. Contexto mundial de la Covid-19 
<br>

#### <FONT COLOR="FF4D00">**ORIGEN DEL COVID-19**</FONT>

La Covid-19 es una enfermedad **infecciosa** causada por un coronavirus recientemente descubierto. 

Tuvo su origen en la ciudad de Wuhan, en China. Y el **primer caso** diagnosticado fue el 17 de noviembre de 2019. Todo y que se ha expandido rapidamente por todo el mundo.

<br>

#### <FONT COLOR="FF4D00">**¿QUÉ ES EL CORONAVIRUS**</FONT>

Los coronavirus son una **serie de virus** llamados así por su forma. Estos organismos no son nuevos, ya que conviven con el ser humano desde siempre. Además, hay muchos tipos de ellos, tanto en animales como en seres humanos.

Sin embargo, el análisis comparativo de esta enfermedad determinó que el SARS-CoV-2 era lo suficientemente distinto de los otros coronavirus de gravedad detectados en humanos (SARS y MERS) como para que este fuera consdierado una nueva enfermedad, recibiendo el nombre de **Covid-19.**


<center><img src="imagenes/covid.jpg" width="350px" /></center>

<br>

#### <FONT COLOR="FF4D00">**¿CÓMO SE PROPAGA EL COVID-19?**</FONT>

El virus que causa la Covid-19 se transmite principalmente a través de la gotículas generadas cuando una persona infectada **tose, estornuda o espira.** [^2]

Estas gotículas son demasiado pesadas para permanecer suspendidas en el aire y caen rapidamente sobre el suelo y/o las superfícies, conviertiendose estas en otra forma  posible de contagio. 

## 3. Datos utilizados para el trabajo. {.tabset}

### <FONT COLOR="FF4D00">**Datos**</FONT>

Obtener los datos es fundamental para poder hacer el análisis.

Por ello, para el presente trabajo utilizaremos los datos que hemos extraido en diferentes páginas web, referenciadas al final del informe (en [Referencias]), y que hemos modificado para poder hacer este análisis.

De manera que, los datos modificado aparecen en la pestaña Tidy. Estos corresponden a aquellos que contienen información sobre los contagiados, recuperados y fallecidos a nivel mundial, estatal y autonómico. 

Así como otras cifras, sobre las diferentes pruebas realizadas (PCR's y Test rápidos), la saturación del sistema santiario español y algunos efectos económicos de la pandemía. 


### <FONT COLOR="FF4D00">**Tidy**</FONT>

La finalidad de este apartado es poner los código que hemos utilizado para "limpiar" los datos y a partir de los cuales hemos podido hacer gráficos, mapas, tablas...

```{r}
#TIDY PARA EL "MUNDO".

library(rio)
library(tidyverse)

url_mundo <- "https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"

df_mundo <- readr::read_csv(url_mundo)

df_mundo <- df_mundo %>% select(-"Province/State") %>%
            separate(Date, c("Año","Mes","Dia"), sep = "-")

df_mundo <- df_mundo  %>%
            relocate("Country/Region", .before=Año) %>%
            relocate(Año, .before=Confirmed)

df_mundo <- df_mundo %>%
            relocate(Mes, .after=Dia)

#A fecha del 01/12:

df_mundo_12 <- df_mundo %>% filter(Mes == "12" & Dia == "01")
df_mundo_12 <- df_mundo_12 %>% select(-Deaths)

#Para ver que hay países que se repiten y habrá que sumar todos los que se repiten:

df <- df_mundo_12 %>% group_by(`Country/Region`) %>% summarise(N = n())
#Países que se repiten: Australia, Canada, China, Denmark, France, Netherlands, United Kingdom.

df_b <- df_mundo_12 %>% filter(!(`Country/Region` %in% c("Australia", "Canada", "China", "Denmark", "France", "Netherlands", "United Kingdom")))


#Para Australia:
df_A <- df_mundo_12 %>% filter(`Country/Region` %in% "Australia")
df_cA <- df_A %>% mutate(Confirmed = sum(Confirmed))
df_cA <- df_cA %>% mutate(Recovered = sum(Recovered))
df_cA <- df_cA %>% slice(1)

#Para China:
df_C <- df_mundo_12 %>% filter(`Country/Region` %in% "China")
df_c <- df_C %>% mutate(Confirmed = sum(Confirmed))
df_c <- df_c %>% mutate(Recovered = sum(Recovered))
df_c <- df_c %>% slice(1)

#Para Denmark:
df_D <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_d <- df_D %>% mutate(Confirmed = sum(Confirmed))
df_d <- df_d %>% mutate(Recovered = sum(Recovered))
df_d <- df_d %>% slice(1)

#Para France:
df_F <- df_mundo_12 %>% filter(`Country/Region` %in% "France")
df_f <- df_F %>% mutate(Confirmed = sum(Confirmed))
df_f <- df_f %>% mutate(Recovered = sum(Recovered))
df_f <- df_f %>% slice(1)

#Para Netherlands:
df_N <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_n <- df_N %>% mutate(Confirmed = sum(Confirmed))
df_n <- df_n %>% mutate(Recovered = sum(Recovered))
df_n <- df_n %>% slice(1)

#Para United Kingdom:
df_U <- df_mundo_12 %>% filter(`Country/Region` %in% "Denmark")
df_u <- df_U %>% mutate(Confirmed = sum(Confirmed))
df_u <- df_u %>% mutate(Recovered = sum(Recovered))
df_u <- df_u %>% slice(1)


#Ahora tengo que juntar las tablas:
tabla <- bind_rows(df_b, df_u, df_n, df_f, df_d, df_c, df_cA)
```

```{r}
#Gráficos de la evolución del Covid-19
library(tidyverse)
url_mundo <- "https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"

df_mundo <- readr::read_csv(url_mundo)

df_mundo <- df_mundo %>% select(-"Province/State") %>%
            separate(Date, c("Año","Mes","Dia"), sep = "-")

df_mundo <- df_mundo  %>%
            relocate("Country/Region", .before=Año) %>%
            relocate(Año, .before=Confirmed)

df_mundo <- df_mundo %>%
            relocate(Mes, .after=Dia)
```

```{r}
#Estos datos muestran el número de muertes diarias en el mundo, los hemos arreglado para poder hacer un facet_wrap con los diferentes meses y la evolución de estos según los dias. 
library(tidyverse)

#Para la tabla de muertes_dia hacemos, separamos por día y mes. Y filtrar las fechas hasta des de las primeras disponibles hasta el 31 de octubre.

library(lubridate)

muertes_dia <- rio::import(here::here("datos", "muertes_dia.xlsx"))

muertes_dia <- muertes_dia %>% mutate(Dia= day(Date)) %>% mutate(Mes= month(Date))  %>%
filter(!Mes == "11")  %>% select(!Date)

muertes_dia <- muertes_dia %>% mutate(Mes = case_when(
  Mes == 1 ~ "Enero",
  Mes == 2 ~ "Febrero",
  Mes == 3 ~ "Marzo",
  Mes == 4 ~ "Abril",
  Mes == 5 ~ "Mayo",
  Mes == 6 ~ "Junio",
  Mes == 7 ~ "Julio",
  Mes == 8 ~ "Agosto",
  Mes == 9 ~ "Septiembre",
  Mes == 10 ~ "Octubre",
))

muertes_dia$facet = factor(muertes_dia$Mes, levels = c("Enero","Febrero","Marzo", "Abril","Mayo","Junio","Julio","Agosto","Septiembre","Octubre"))
```

```{r}
#Datos_CCAA
urla <-"https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv"
aaa <- rio::import(urla)

#Hay que tener en cuenta que la variable % Camas Ocupadas UCI Covid no tiene datos hasta el 21-09-2020 por lo tanto para analizar la segunda OLA si que nos sirve pero no para la primera
library(tidyverse)


datos_CCAA <- aaa %>%
  separate(Fecha, c("Año","Mes","Dia"), sep = "-") %>%
  select(-CCAA) %>% mutate(CCAA = case_when(
  cod_ine == 0 ~ "España",
  cod_ine == 1 ~ "Andalucia",
  cod_ine == 2 ~ "Aragon",
  cod_ine == 3 ~ "Asturias",
  cod_ine == 4 ~ "Islas Baleares",
  cod_ine == 5 ~ "Canarias",
  cod_ine == 6 ~ "Cantabria",
  cod_ine == 7 ~ "Castilla Leon",
  cod_ine == 8 ~ "Castilla La Mancha",
  cod_ine == 9 ~ "Cataluña",
  cod_ine == 10 ~ "Com.Valenciana",
  cod_ine == 11 ~ "Extremadura",
  cod_ine == 12 ~ "Galicia",
  cod_ine == 13 ~ "Madrid",
  cod_ine == 14 ~ "Murcia",
  cod_ine == 15 ~ "Navarra",
  cod_ine == 16 ~ "Pais Vasco",
  cod_ine == 17 ~ "La Rioja",
  cod_ine == 18 ~ "Ceuta",
  cod_ine == 19 ~ "Melilla",
)) %>% relocate(CCAA, .after=cod_ine)

datos_CCAA <- datos_CCAA %>% rename("Ingresos Ult.24h" = "Ingresos COVID Ãºltimas 24 h") %>% rename("Altas Ult24h" = "Altas COVID Ãºltimas 24 h")
```

```{r pruebas_CCAA}
library(rio)
library(tidyverse)
#link: https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv

dfp <- rio::import(here::here("datos", "datos_pruebas.xlsx"))

dfa <-dfp %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes) %>% select(!OTROS_TESTS) %>% select(!OTROS_TESTS_x_1000hab.)

dfCCAA <- dfa %>% filter(CCAA != "España")

#Exporto los datos para poder empezar el análisis desde aquí.
#rio::export(dfCCAA, here::here("datos", "dfCCAA.csv"))

dfCCAA <- rio::import(here::here("datos", "dfCCAA.csv"))

dfCCAA <- dfCCAA %>% select(!CCAA)
dfCCAA <- dfCCAA %>% mutate(CCAA = case_when(
  cod_ine == 1 ~ "Andalucia",
  cod_ine == 2 ~ "Aragon",
  cod_ine == 3 ~ "Asturias",
  cod_ine == 4 ~ "I.Baleares",
  cod_ine == 5 ~ "Canarias",
  cod_ine == 6 ~ "Cantabria",
  cod_ine == 7 ~ "Castilla Leon",
  cod_ine == 8 ~ "Castilla La Mancha",
  cod_ine == 9 ~ "Cataluña",
  cod_ine == 10 ~ "C.Valenciana",
  cod_ine == 11 ~ "Extremadura",
  cod_ine == 12 ~ "Galicia",
  cod_ine == 13 ~ "Madrid",
  cod_ine == 14 ~ "Murcia",
  cod_ine == 15 ~ "Navarra",
  cod_ine == 16 ~ "Pais Vasco",
  cod_ine == 17 ~ "La Rioja",
  cod_ine == 18 ~ "Ceuta",
  cod_ine == 19 ~ "Melilla",
)) %>% relocate(CCAA, .after=cod_ine)
```
```{r PROVINCIAS}
library(rio)
library(tidyverse)

dfPROV <- rio::import(here::here("datos", "dfTrel.csv"))

dfPROV <- mutate(dfPROV %>% mutate(Cod = case_when(
     provincia == "Alava" ~ "01",
     provincia == "Albacete" ~ "02",
     provincia == "Alicante" ~ "03",
     provincia == "Almeria" ~ "04",
     provincia == "Avila" ~ "05",
     provincia == "Badajoz" ~ "06",
     provincia == "Islas Baleares" ~ "07",
     provincia == "Barcelona" ~ "08",
     provincia == "Burgos" ~ "09",
     provincia == "Caceres" ~ "10",
     provincia == "Cadiz" ~ "11",
     provincia == "Castellon" ~ "12",
     provincia == "Ciudad Real" ~ "13",
     provincia == "Cordoba" ~ "14",
     provincia == "A Coruña" ~ "15",
     provincia == "Cuenca" ~ "16",
     provincia == "Girona" ~ "17",
     provincia == "Granada" ~ "18",
     provincia == "Guadalajara" ~ "19",
     provincia == "Guipuzcoa" ~ "20",
     provincia == "Huelva" ~ "21",
     provincia == "Huesca" ~ "22",
     provincia == "Jaen" ~ "23",
     provincia == "Leon" ~ "24",
     provincia == "Lleida" ~ "25",
     provincia == "La Rioja" ~ "26",
     provincia == "Lugo" ~ "27",
     provincia == "Madrid" ~ "28",
     provincia == "Malaga" ~ "29",
     provincia == "Murcia" ~ "30",
     provincia == "Navarra" ~ "31",
     provincia == "Ourense" ~ "32",
     provincia == "Asturias" ~ "33",
     provincia == "Palencia" ~ "34",
     provincia == "Las Palmas" ~ "35",
     provincia == "Pontevedra" ~ "36",
     provincia == "Salamanca" ~ "37",
     provincia == "Tenerife" ~ "38",
     provincia == "Cantabria" ~ "39",
     provincia == "Segovia" ~ "40",
     provincia == "Sevilla" ~ "41",
     provincia == "Soria" ~ "42",
     provincia == "Tarragona" ~ "43",
     provincia == "Teruel" ~ "44",
     provincia == "Toledo" ~ "45",
     provincia == "Valencia" ~ "46",
     provincia == "Valladolid" ~ "47",
     provincia == "Bizkaia" ~ "48",
     provincia == "Zamora" ~ "49",
     provincia == "Zaragoza" ~ "50",
     provincia == "Ceuta" ~ "51",
     provincia == "Melilla" ~ "52")))

dfPROV <- dfPROV %>% select(provincia, Cod, Poblacion, Total, Totalxcap) %>% arrange(Cod)
```

```{r}
#Preparando los datos para el análisis de las provincias
library(tidyverse)

df_prov <- rio::import(here::here("datos", "datos_provincias.csv"))

df_prov <- df_prov %>% separate(fecha, c("dia","mes","año"), sep = "--")

df_prov <- df_prov %>% select(provincia_iso, provincia, dia, mes, año, num_casos)

library(rio)

rio::export(df_prov, here::here("datos", "datos_provinciasok.csv"))

df <- rio::import(here::here("datos", "datos_provinciasok.csv"))

dfg <- df %>% select(-provincia_iso) %>% select(-año)

dfhab <- rio::import(here::here("datos", "excel_hab_prov.xlsx"))

tabla <- full_join(dfg, dfhab, by = c("provincia" = "Provincia"))

dfgg <- tabla %>% group_by(provincia, mes, Poblacion) %>% summarise(Num = sum(num_casos))

dfgg <- dfgg %>% select(provincia, Poblacion, mes, Num)


dfrel <- dfgg %>% mutate(Total_cap = (Num/Poblacion))
dfT <- dfgg %>% group_by(provincia, Poblacion) %>% summarise(Total = sum(mes, Num))

dfTrel <- dfT %>% mutate(Totalxcap = (Total/Poblacion))

unique(dfTrel$provincia)
dfTrel$provincia <- gsub("Santa Cruz de Tenerife", "Tenerife",dfTrel$provincia)

rio::export(dfTrel, here::here("datos", "dfTrel.csv"))
```


##  4. Estudio sobre los **Datos del MUNDO**

### 4.1 Preguntas y respuestas de la situación actual.

```{r}
df <- rio::import(here::here("datos", "tabla_mundo.csv"))

#Con esto podemos hacer unas tablas.

dfmax1 <- df %>% slice_max(Confirmed, n=1) #Estados Unidos es el país con más contagios.

dfmax2 <- df %>% slice_max(Recovered, n=1) #El máximo de recuperados está en India.

df_min1 <- df %>% slice_min(Confirmed, n=1) #El país con menos contagios es Vanuatu (es un país Oceania)

```

```{r}
#TABLA PARA EL PAÍS CON MENOS CONATGIOS.

Imagen <- "http://banderasmundo.es/wp-content/uploads/2017/09/vanuatu.png"

df_min1 <- df_min1 %>% add_column(Imagen)
df_min1 <- df_min1 %>% select(-c(Dia, Mes, Año))

library(gt)
Tabla_Pmencotag <- df_min1 %>% gt()

Tabla_Pmencotag <- Tabla_Pmencotag %>%
                   tab_header(title = md("**País con menos contagios de Covid-19**"),subtitle = md("A fecha: 1/12/2020"))

Tabla_Pmencotag <- Tabla_Pmencotag %>%
                tab_options(heading.background.color = "coral") %>% tab_options(heading.title.font.size = 15, heading.subtitle.font.size = 13,  column_labels.font.weight =  "bold")


Tabla_Pmencotag <- Tabla_Pmencotag  %>%
  gt::text_transform(locations = cells_body(columns = vars(Imagen)), fn = function(x) {gt::web_image(x, height = 50)}) %>%  cols_align(
    align = "center")

#Lo mismo hacemos para las otras tres tablas
```

```{r echo=FALSE, eval=TRUE}

#TABLA PARA EL PAÍS CON MÁS CONTAGIOS:


ImagenUS <- "https://upload.wikimedia.org/wikipedia/commons/a/a4/Flag_of_the_United_States.svg"

dfmax1 <- dfmax1 %>% add_column(ImagenUS)
dfmax1 <- dfmax1 %>% select(-c(Dia, Mes, Año))

library(gt)
Tabla_Pmascotag <- dfmax1 %>% gt()

Tabla_Pmascotag <- Tabla_Pmascotag %>%
                   tab_header(title = md("**País con más contagios de Covid-19**"),subtitle = md("A fecha: 1/12/2020"))

Tabla_Pmascotag <- Tabla_Pmascotag %>%
                tab_options(heading.background.color = "coral") %>% tab_options(heading.title.font.size = 15, heading.subtitle.font.size = 13,  column_labels.font.weight =  "bold")


Tabla_Pmascotag <- Tabla_Pmascotag  %>%
  gt::text_transform(locations = cells_body(columns = vars(ImagenUS)), fn = function(x) {gt::web_image(x, height = 50)}) %>%  cols_align(
    align = "center")

#PAÍS CON MÁS RECUPERADOS DE COVID-19

ImagenI <- "https://www.banderas-mundo.es/data/flags/w580/in.png"

dfmax2 <- dfmax2 %>% add_column(ImagenI)
dfmax2 <- dfmax2 %>% select(-c(Dia, Mes, Año))


library(gt)
Tabla_Pmasrecu <- dfmax2 %>% gt()


Tabla_Pmasrecu <- Tabla_Pmasrecu %>%
                   tab_header(title = md("**País con más recuperados de Covid-19**"),subtitle = md("A fecha: 1/12/2020"))

Tabla_Pmasrecu <- Tabla_Pmasrecu %>%
                tab_options(heading.background.color = "coral") %>% tab_options(heading.title.font.size = 15, heading.subtitle.font.size = 13,  column_labels.font.weight =  "bold")


Tabla_Pmasrecu <- Tabla_Pmasrecu  %>%
  gt::text_transform(locations = cells_body(columns = vars(ImagenI)), fn = function(x) {gt::web_image(x, height = 50)}) %>%  cols_align(
    align = "center")
```


<br>
<center><FONT COLOR="Blue">**¿CUÁL ES EL PAÍS CON MÁS PERSONAS CONTAGIADAS?**</FONT></center>
 
<br>
```{r echo = FALSE, eval = TRUE}
Tabla_Pmascotag
```


<br>
<center><FONT COLOR="Blue">**¿EN QUÉ PAÍS HAY MÁS PERSONAS RECUPERADAS?**</FONT></center>
<br>
```{r echo = FALSE, eval = TRUE}
Tabla_Pmasrecu
```

<br>
<center><FONT COLOR="Blue">**¿CUÁL ES EL PAÍS CON MENOS CONTAGIOS?**</FONT></center>
<br>
```{r echo = FALSE, eval = TRUE}
Tabla_Pmencotag
```


El país más afectado hoy en día por la pandemia es Estados Unidos, como podremos confirmar a lo largo del análisis. Además, India pese a que tiene un gran número de recuperados (en la fecha indicada en la tabla) no deja de tener contagiados y su cifra va en aumento. 

Filtrando los datos extraidos del repositorio de Github Covid-19, hemos obtenido que el país con menos contagios es Vanuatu, un país insular de Ocenia, que en estos momentos tiene solo 1 persona confirmada de coronavirus, por lo que es el país con menos casos hasta el momento. (Además, cabe tener en cuenta que esta isla cuenta con muy poca población (292.680 habitantes))


### 4.2 Los 10 países con más casos de Coronavirus, ¿Cuáles son?

```{r echo = FALSE, eval= TRUE}
#Gráfico con los 10 países que más casos de coronavirus presentan.
#Lo he sacado a partir de aquí: https://rpubs.com/JonathanRzezak/652633 !!!!

#remotes::install_github("kjhealy/covdata@main")

library(covdata)
library(tidyverse)
library(lubridate)
library(gganimate)
library(gifski)
library(RColorBrewer)

#install.packages("Cairo")
library(Cairo)

covid <- covnat %>%
  group_by(date) %>%
  arrange(date, desc(cu_cases)) %>%
  mutate(ranking = row_number()) %>%
  filter(ranking <= 10)

#unique(covid$cname) #Esto nos sirve para ver la variable que muestra el nombre de las regiones del df covid.

#De esta manera ha cambiado algunos nombres de la fila cname, también se podía haber hecho con la función case_when.

covid$cname <- gsub("Taiwan, Province of China", "Taiwan", covid$cname)
covid$cname <- gsub("Iran, Islamic Republic of", "Iran", covid$cname)
covid$cname <- gsub("Russian Federation", "Russia", covid$cname)
covid$cname <- gsub("Korea, Republic of", "South Korea", covid$cname)
covid$cname <- gsub("United Arab Emirates", "UAE", covid$cname)

#cu_cases son los casos acumulados.

#install.packages("RColorBrewer")
nb.cols <- 50
mycolors <- colorRampPalette(brewer.pal(12, "Paired"))(nb.cols)
```

```{r}
a <- ggplot(covid)+
  geom_col(aes(ranking,cu_cases,fill=cname))+
  scale_fill_manual(values=mycolors)+
  geom_text(aes(ranking,cu_cases,label=as.factor(cu_cases)),hjust=-0.1,size=5)+
  geom_text(aes(ranking, y=0 , label = cname), hjust=1.1,size=5) +
  geom_text(aes(x=10, y=max(cu_cases) , label = as.factor(date)), vjust = 0, hjust=1, alpha = 0.1,  col = "black", size = 20)+
  labs(title = "Evolución de los casos positivos de Covid-19 en el mundo",
       subtitle = "Datos de la Universidad Johns Hopkins",
       x=NULL,
       y=NULL)+
  coord_flip(clip = "off")+
  scale_x_reverse()+
  theme_minimal()+
  theme(legend.position = "none",
        axis.title.y = element_blank(),
        axis.title.x = element_blank(),
        axis.text.y = element_blank(),
        axis.text.x = element_blank(),
        plot.title = element_text(hjust = 0, size=20,face="bold"),
        plot.subtitle = element_text(hjust = 0, size=12, face="italic"),
        plot.margin = margin(1, 4, 1, 3, "cm"))+
  transition_states(date,transition_length = 1,state_length = 0,wrap = FALSE)
```

```{r out.width="100%"}
 animate(a,
        nframes = 800,
        fps = 24,
        end_pause = 200,
        width = 1000,
        height = 600,
        type = "cairo")
```

Con el anterior gráfico pretendemos mostrar la evolución de los casos positivos en coronavirus, mostrando los 10 países que se encuentran en el "top". Estos datos van desde incioos de enero hasta principios de diciembre (año 2020)

Observamos que China es el primer país en tener positivos en coronavirus, como sabemos Wuhan fue el lugar donde se detectó el primer positivo. El coronavirus se propaga rapidamente por todo el mundo y vemos a través del gráfico que Italia y España rapidamente pasan a tener un número elevado de contagios, el cual es superado por Estados Unidos en marzo, donde los casos crecen de manera exponencial.

Los últimos datos mostrados indican que India, Brasil y Rusia se situan en la segunda, tercera y cuarta posición respectivamente en contagios. En decima posición se encuentra México con 1.144.643 de casos acumulados.

### 4.3 Evolución de los contagios (a nivel mundial)

Para poder entender como ha sido la propagación del virus a nivel mundial nos parecia interesante analizar diferentes países que no fueran parecidos entre si. Para ello elegimos estos países - **Estados Unidos, Nigeria, Portugal y Japón** - e hicimos un gráfico donde mostramos la evolución de los casos registrados diariamente.  

```{r US}
#Gráfico para US:
df_mundoUS<- df_mundo %>% filter(`Country/Region` == "US") %>% select(-c(Recovered, Deaths))

df_mundoUSS <- df_mundoUS %>% summarise(dif = diff(Confirmed))

dfUS <- df_mundoUS %>% select(`Country/Region`,Dia, Mes)
dfUS <- dfUS %>% slice(-1)
US <- bind_cols(dfUS, df_mundoUSS)

US <- US %>% mutate(ranking = row_number())

graficoUS <- ggplot(US, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "EEUU",  x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) +  theme(legend.position = "none")

#Ibamos ha hacerlo también de Australia, pero no lo he hecho porque el número de casos es bastante bajo y la diferencia entre un día y otro sale negativa. (Por lo que el gráfico no se ve bien)

#Mismo proceso para Nigeria, Japón y Portugal
#Por tanto, pongo el código para que no se vea. (echo=FALSE)
```


```{r Nigeria,  echo=FALSE, eval=TRUE}

#Para Nigeria:

df_mundoN<- df_mundo %>% filter(`Country/Region` == "Nigeria") %>% select(-c(Recovered, Deaths))

df_mundoNN <- df_mundoN %>% summarise(dif = diff(Confirmed))

dfN <- df_mundoN %>% select(`Country/Region`,Dia, Mes)
dfN <- dfN %>% slice(-1)
N <- bind_cols(dfN, df_mundoNN)

N <- N %>% mutate(ranking = row_number())

graficoN <- ggplot(N, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "Nigeria", x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) +  theme(legend.position = "none")

```



```{r Japón, echo=FALSE, eval=TRUE}

#Para Japón

df_mundoJ<- df_mundo %>% filter(`Country/Region` == "Japan") %>% select(-c(Recovered, Deaths))

df_mundoJJ <- df_mundoJ %>% summarise(dif = diff(Confirmed))

dfJ <- df_mundoJ %>% select(`Country/Region`,Dia, Mes)
dfJ <- dfJ %>% slice(-1)
J <- bind_cols(dfJ, df_mundoJJ)

J <- J %>% mutate(ranking = row_number())

graficoJ <- ggplot(J, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "Japón",  x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "none")
```

```{r Portugal, echo = FALSE,eval=TRUE}
#Para Portugal

df_mundoP<- df_mundo %>% filter(`Country/Region` == "Portugal") %>% select(-c(Recovered, Deaths))

df_mundoPP <- df_mundoP %>% summarise(dif = diff(Confirmed))

dfP <- df_mundoP %>% select(`Country/Region`,Dia, Mes)
dfP <- dfP %>% slice(-1)
P <- bind_cols(dfP, df_mundoPP)

P <- P %>% mutate(ranking = row_number())

graficoP <- ggplot(P, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "Portugal",  x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5))+  theme(legend.position = "none")
```


```{r echo=FALSE, eval = TRUE,  out.width="90%" }
library(patchwork)
(graficoUS + graficoP) / (graficoJ + graficoN)
```
Cabe tener en cuenta que los colores muestran los diferentes meses, empezando en Enero y acabando en Noviembre.

A la vista del gráfico observamos que la evolución en los distintos países es muy diferente. En <FONT COLOR="FF4D00">**PORTUGAL**</FONT>, al **principio de la pandemia se muestra un aumento en la curva, aunque es muy poco pronunciado** y **seguidamente los casos bajan y se mantienen en valores muy bajos durante un período de tiempo (meses) largo** hasta que empieza la **segunda ola donde los casos se disparan teniendo su máximo en casi 8000 casos registrados en un solo dia**.

La evolución de <FONT COLOR="FF4D00">**NIGERIA**</FONT>, en cambio es muy diferente en este país **el virus llega más tarde que los demás** y la **primera ola parece ser mayor que la segunda**, aunque no se pueden tampoco sacar demasiadas conclusiones ya que el sistema sanitario de este país no es comparable al de los otros tres países analizados. 

<FONT COLOR="FF4D00">**JAPÓN**</FONT>, sufre como vemos en el gráfico **tres picos** muy claros. `**El primero, al principio de la pandémia, el siguiente unos meses más tarde y cuando parecia que podian controlar la situación los casos empezaron a aumentar progresivamente** hasta llegar a máximos nunca vistos antes en la pandemia.

Por último, el caso de <FONT COLOR="FF4D00">**ESTADOS UNIDOS**</FONT>
es diferente ya que **la curva es siempre ascendente** y no ofrece cambios extremadamente bruscos como la de los otros países. Su tendencia es clara, **cada vez mas casos teniendo el pico máximo en las fechas más recientes**

<br>

### Continuamos con el análisis a nivel mundial, para ello ahora utilizaremos el paquete **tidycovid19**

```{r echo = TRUE, eval = FALSE}
#remotes::install_github("joachim-gassen/tidycovid19")
library(tidycovid19)

#install.packages("maps")
library(lubridate)

merged <- download_merged_data(cached = TRUE, silent = TRUE)

a <- plot_covid19_stripes(
  type = "confirmed",
  countries = c("CHN" , "ESP",  "BRA", "ZAF", "UK", "USA"),
  sort_countries = "countries")

a <- a + theme_test() +  theme(legend.direction = "horizontal") + theme(legend.position = "bottom") +
  labs(title = "COVID-19 -CASOS DIARIOS", subtitle = " Muestra el cambio diario en casos confirmados (promedio de 7 días)", caption = "Datos obtenindos de Johns Hopkins University CSSE Github
  Repo: https://github.com/joachim-gassen/tidycovid19.
       Últimos datos obtenidos 09/12/2020")  
     

a <- a + theme(plot.title = element_text(hjust = 0.5)) +  theme(plot.subtitle = element_text(hjust = 0.5))  

```


```{r eval = TRUE, echo = FALSE, out.width="70%"}
knitr::include_graphics(here::here("imagenes", "barras.png"))
```
<a href="./imagenes/barras.png" target="_blank">[Ampliar Imagen]</a>


En el gráfico anterior se contrasta lo que se ha comentado anteriormente. **El país con más casos diarios actualmente es Estados Unidos**, su tendencia es clara, como se ha dicho antes, no paran de aumentar los casos. Parecida a esta es la tendencia que observamos en Brasil, donde el primer caso se confirmó el 25 de febrero de 2020, en el estado de São Paulo, por parte de un brasileño que viajó a Italia con sintomas leves.

Por otra parte tenemos a **España** y **Sud-Africa**, sus gráficos si muestran las famosas olas donde los casos aumentaban paro luego se reducian. Concretamente en el caso de España se pueden ver como hacia el final, meses más recientes,  vuelven a aparecer tonos mas verdosos lo que significa que los casos han disminuido, en comparación con los meses de marzo-abril.

El país restante es **China** donde según los datos que tenemos la Pandemia esta controlada ya que los valores son infimos para la población que tiene el gigante asiático. Además, se observa que al principio de la crisi sanitaria presentaba más casos que el resto de países analizados (en este gráfico)

<br>

```{r echo = TRUE, eval = FALSE}
mapaCD <- map_covid19(
  data = download_merged_data(cached = TRUE, silent = TRUE),
  type = "deaths",
  cumulative = FALSE,
  change_ave = 7,
  per_capita = TRUE)

library(ggplot2)
mapaCD <- mapaCD + labs(title = "COVID-19",
                        subtitle = "Muestra la variación diaria de muertes por 100.000 habitantes (promedio durante 7 dias)", caption = "Datos del día 07/12/2020,  
Datos obtenindos de Johns Hopkins University CSSE Github Repo: https://github.com/joachim-gassen/tidycovid19.") +
  theme(plot.title = element_text(hjust = 0.5)) +  
  theme(plot.subtitle = element_text(hjust = 0.5))

mapaCD +   scale_fill_viridis_c(direction = -1)
```

```{r eval = TRUE, echo = FALSE, out.width="70%"}
knitr::include_graphics(here::here("imagenes", "Muertes_diarias.png"))
```
<a href="./imagenes/Muertes_diarias.png" target="_blank">[Ampliar Imagen]</a>

Este mapa nos muestra la variación de muertes por 100 mil habitantes en un promedio de 7 días.  Los datos son de la semana del 7 de diciembre. 
En este mapa, se puede recalcar que la zona más afectada por muertes por COVID es el centro de Europa, donde podríamos destacar países como Italia, Eslovenia o Bulgaria. Otro de los países más afectados por el coronavirus sin duda es Estados Unidos donde destaca tanto en muertes, como en contagios.
También se puede ver que los países donde menos muertes por 100 mil habitantes están habiendo, son países de África, Oceanía y parte de Asia.


```{r echo = TRUE, eval = FALSE}
mapaCC <- map_covid19(
  data = download_merged_data(cached = TRUE, silent = TRUE),
  type = "confirmed",
  cumulative = FALSE,
  change_ave = 7,
  per_capita = TRUE)

mapaCC <- mapaCC + labs(title = "COVID-19 - CASOS CONFIRMADOS",
                        subtitle = "Muestra la variación diaria de casos confirmados por 100.000 habitantes (promedio durante 7 dias)", caption = "Datos del día 07/12/2020,  
Datos obtenindos de Johns Hopkins University CSSE Github Repo: https://github.com/joachim-gassen/tidycovid19.") +
  theme(plot.title = element_text(hjust = 0.5)) +  
  theme(plot.subtitle = element_text(hjust = 0.5))

mapaCC + scale_fill_viridis_c(direction = -1)
```

```{r eval = TRUE, echo = FALSE, out.width="60%"}
knitr::include_graphics(here::here("imagenes", "Casosconfirmados.png"))
```
<a href="./imagenes/Casosconfirmados.png" target="_blank">[Ampliar Imagen]</a>

Este mapa nos muestra la variación de casos confirmados por 100 mil habitantes en un promedio de 7 días.  Los datos so de la semana del 7 de diciembre. 

Como podemos observar, las zonas donde menos casos se confirman son en zonas de África (hay que tener en cuenta que se realizan menos pruebas que en el resto de los continentes) Por otro lado, hay otras zonas como Australia y parte de Asia donde también hay pocos contagios confirmados. 

Las zonas más afectadas serían zonas de Europa, Rusia y Estados Unidos.

```{r}

#remotes::install_github("joachim-gassen/tidycovid19")
library(ggplot2)
library(tidyverse)
library(tidycovid19)

dfz <- download_merged_data(silent = TRUE, cached = TRUE)

dfz <- dfz %>% group_by(iso3c) %>% summarise(
    confirmed_cases = max(confirmed, na.rm = TRUE),
    soc_dist_measures = max(soc_dist)
  ) %>% filter(confirmed_cases >= 1000)

DF <- dfz %>% arrange(desc(confirmed_cases))

DF <- dfz %>% slice_max(confirmed_cases, n=20)%>% slice(-7)

ggplot(DF, aes(x = confirmed_cases, y = soc_dist_measures, color = iso3c)) + geom_point() +
scale_x_continuous(trans='log10', labels = scales::comma) +
ggrepel::geom_label_repel(ggplot2::aes(label = iso3c)) + labs(title = "RELACIÓN ENTRE LOS CASOS CONFIRMADOS Y LAS MEDIDAS TOMADAS",
subtitle = "Relación hecha para los 20 países con más contagios" ,caption = "Datosdel repositorio de Github de CSSE de la Uni.
Johns Hopkins. Paquete <<tidycovid19>>", y = "Medidas distancia social", x = "Casos confirmados") +
theme_bw() +  theme(legend.position = "none") +  theme(plot.title = element_text(hjust = 0.5)) +  theme(plot.subtitle = element_text(hjust = 0.5))
```
En este gráfico se muestra la relación existente entre el número de casos (contagios) y el número de medidas de distanciamiento social aplicadas en cada uno de los países de la muestra (netos de restricciones levantadas)

Se encargan de recopilar estos datos ACAPS, un proyecto no gubernamental. [^3]

En este caso se muestra el número de medidas de distanciamiento social informadas hasta la fecha por ACAPS, neto de restricciones levantadas. Todo y que también se puede ver la relación con otras medidas que recoge este proyecto, tales como el número de medidas sociales y económicas o de reestricciones de movimiento, etc. 

De acuerdo con el gráfico, observamos que el país del mundo con más contagios actualmente, Estados Unidos, ha aplicado un nivel de medidas de distancia social muy bajo, en comparación con otros países, como en Gran Bretaña, donde Boris Johnson se ha visto obligado a imponer  reglas de distanciamiento social dado la desbordada situación en la que se encontraba. Teniendo en cuenta además, que al inicio de la pandemia evitó poner medidas drásticas, todo y que su estratégia tuvo que cambiar al ver que el virus estaba cogiendo fuerza en su país.

España se encuentra a día de hoy con 1,73 M de casos acumulados, las estrategias para reducir el contagio se han basado principalmente en reducir la movilidad de las personas, por ello, el 13 de marzo se declaró el Estado de Alarma con confinamiento domiciliario. Esta primera cuarentena se levantó el pasado 21 de junio, con una reducción considerable de los casos. Todo y que ha aumentado en los meses posteriores, haciendo referencia a la "segunda ola" (o incluso, algunos hablan de una "tercera ola")

### 4.4 Evolución de los fallecidos (a nivel mundial)


```{r graficoM}
library(gganimate)
library(plotly)

graficoM <- ggplot(muertes_dia , aes(Dia , Daily_Deaths,  color= Mes))  + geom_line() + geom_point() +
  labs(title = "Evolución de muertes al día en el mundo por Covid",
    subtitle = "Desde el 24 de Enero hasta el 31 de Octubre", caption = "Elaboración propia con datos 
    del repositorio COVID19",
    y = "Muertes diarias", x = "Dias") +  
  theme(legend.position = "none") + scale_x_continuous(breaks = seq(1, 30, 5)) + 
  facet_wrap(~facet, nrow = 4, ncol = 3)  + transition_reveal(Dia)
```

En el siguiente conjunto de gráficos observamos la evolución de las muertes por Covid en todo el mundo.

```{r echo= FALSE, eval = TRUE, out.width="80%"}
graficoM
```

Como podemos observar es a partir del tercer mes, el mes de Marzo cuando las muertes empiezan a ser significativas llegando al máximo total en Abril donde rozaron las 8000 muertes en un dÍa. A partir de ahí y en vista de los gráficos observamos que las cifras tienen tendencias muy parecidas, es decir, se mantiene bastante constante el número de fallecidos diarios y fluctua entre los 6000 y los 4000 muertos diarios continuando esta tendencia hasta el mes de Octubre. 

Cabe añadir la aclaración de que aquí se representan el número de fallecidos a escala mundial y que dentro de cada país hay diferencias, puede ser que en un país haya disminuido el número de muertes diarias, mientras que en otro haya aumentado. Además, aquí no podemos considerar primera ola y/o segunda ola, dado que en cada país la evolución de la pandemía ha sido un tanto diferente, como hemos podido comprobar anteriormente con cuatro países y sus respectivas curvas.

##  5. Conclusiones sobre los "Datos del Mundo". {.tabset}

### <FONT COLOR="FF4D00">**Conclusiones**</FONT>

En esta primera sección se ha pretendido analizar la Covid-19, a nivel mundial.
Como conclusiones, podemos extraer que la pandemia se está (o ya se ha) expandido rapidamente por todo el mundo.

A través de los diferentes gráficos hemos podido comprobar como la pandemía está fuera de control en Estados Unidos, siendo el país líder con más contagios. A este le siguen (a día de hoy), la India, Brasil y Rusia.

Asimismo, como curiosidad cabe destacar qeu el país con menos contagios a día 1/12 (2020) es Vanautu, una isla de Oceania, que presenta tan solo 1 caso.

Por otra parte pretendemos mostrar como ha afectado la pandemia en diferentes países, por ello hemos cogido EEUU, Portugal, Japón y Nigeria y hemos hecho una serie de gráfico, en los cuales podemos los diferentes casos por Covid que hay al día. En el caso de EEUU y Japón se observara dos picos claros.

A diferencia de Nigeria, por ejemplo, donde además de valores más bajos por el
momento se puede considerar que ha habido solo "una ola". En el caso de Portugal, en la segunda ola hay un aumento de los contagios.

Utilizando el paquete Tidycovid19 nos ha permitido mostrar de manera rápida y sencilla el número de casos diarios en diferentes países, donde se confirma que en China los casos eran más abundantes al principio de la pandemia.

De igual modo, con este paquete hemos hecho dos mapas, uno de la variación de las muertes por cada 100 mil habitantes e igual para el número de casos, donde se confirma también lo comentado previamente. (Además,  podemos observar que el continente oceánico y africano son los que menos casos y muertes presentan)

Por último, con el fin de mostrar la evolución de los fallecidos hemos hecho un gráfico, en el cual se observa como en marzo la tendencia era alcista, mientras en los meses restantes parece oscilar en las mismas cifras, un nivel alto y preocupante.

(Para ver los casos, muertes y recuperados de manera dinámica podemos ver el [LiveMap])

### <FONT COLOR="FF4D00">**Live Map**</FONT> 

En este apartado se muestra una bola del mundo dinámica. En ella se recoge el número de muertes, fallecidos y recuperados para cada país, como podemos observar.

Los datos provienen del Centro de ciencia e ingeniería de sistemas (JHU CSSE) de la Universidad Johns Hopkins.

Se actualizan cada día y se obtiene rapidamente gracias a la función **live.map** del paquete: **covid19.analytics**. 

```{r}

library(covid19.analytics)

library(tidyverse)

data <- covid19.data()

data <-data %>%
       select(-c(FIPS,Admin2,Combined_Key)) %>%
       relocate(Lat, .after=Case_Fatality_Ratio) %>%      relocate(Long_, .after=Lat)
```


```{r out.width="100%", eval = TRUE, echo= FALSE}
live.map(data, title = "CORONAVIRUS EN EL MUNDO", no.legend = TRUE)
```


## 6. Estudio sobre los **datos de ESPAÑA**

### 6.1 Datos de interés

<br>
**¿CUÁL FUE LA EVOLUCIÓN DE LOS CONTAGIOS DURANTE LOS 6 PRIMEROS MESES?**


```{r}
#Tabla para poder interpretar el gráfico y consultar más datos

df_mundoE<- df_mundo %>% filter(`Country/Region` == "Spain") %>% select(-c(Recovered, Deaths))

df_mundoEE <- df_mundoE %>% summarise(dif = diff(Confirmed))
dfE <- df_mundoE %>% select(`Country/Region`,Dia, Mes)

df_mundoEsp<- df_mundo %>% filter(`Country/Region` == "Spain") %>% slice(-1)

#Hemos quitados dos de los datos mostrados, ya que distorsionan la gráfica. (Son datos no correctos que contienen valor 0)
Union <- bind_cols(df_mundoEsp, df_mundoEE)
Union <- Union %>% slice(-93)
Union <- Union %>% slice(-115)
Union <- Union %>% slice(-122)
Union <- Union %>% slice(-124)
Union <- Union %>% slice(-50)
Union <- Union %>% mutate(ranking = row_number())

Union <- Union  %>% select(Orden="ranking", Dia, Mes, `Contagios/dia` = "dif", ConfirmadosT="Confirmed", RecuperadosT="Recovered", MuertesT="Deaths")
```


 **TABLA RESUMEN**
```{r}
#En la siguiente tabla se muetra para España el número de contagios al día que hubo en tal fecha y el número de contagios, muertes o recuperados acumulados. Hay que poner una nota de págona diciendo que a partir de julio los fines de semana num de contagios/dia sale como 0)

library(reactable)
reactable(Union, defaultPageSize =  10,  paginationType = "jump", showPageSizeOptions =  TRUE , pageSizeOptions =  c ( 10 , 50 , 100 ),defaultColDef = colDef(
    align = "center",
    minWidth = 70,
    headerStyle = list(background = "lightgreen"),
    filterable = TRUE),  highlight = TRUE, outlined = TRUE,
    columns = list(
  `Contagios/dia` = colDef(style = function(value) {
    if (value > 0) {
      color <- "#e00000"}
      else {
      color <- "#008000"
    }
    list(color = color, fontWeight = "bold")
  })))
```
*Hay que tener en cuenta que a partir de julio los datos en fin de semana tienen un valor de 0, no obstante, deberían obviarse al consultar los datos en la tabla, ya que no resultan coherentes.  

A partir de los datos representados en la tabla anteror, hemos hecho el siguiente gráfico, en él se muestra la evolución de los contagios de Covid en España desde enero hasta junio [^4]

Podemos observar, por tanto,  la "curva" de la <FONT COLOR="FF4D00">**Primera OLA**</FONT>

```{r}
#Gráfico de la evolución de los contagios en España des de enero hasta junio. He cogido estos meses, porque a partir de julio, los datos de los fines de semana son 0, por lo que el gráfico que sale no representa realmente el número de contagios.

df_mundoE<- df_mundo %>% filter(`Country/Region` == "Spain") %>% select(-c(Recovered, Deaths))

df_mundoEE <- df_mundoE %>% summarise(dif = diff(Confirmed))
dfE <- df_mundoE %>% select(`Country/Region`,Dia, Mes)

dfE <- dfE %>% slice(-1)
a <- bind_cols(dfE, df_mundoEE)
b <- a %>% filter(Mes %in% c("01", "02", "03", "04", "05", "06"))

b <- b%>% slice(-93) 
b <- b%>% slice(-115)
b <- b %>% slice(-122)
b <- b %>% slice(-124)
b <- b%>% slice(-50)
b <- b %>% mutate(ranking = row_number())

g6 <- ggplot(b, aes(ranking, dif, color = Mes)) + geom_line() + labs(title = "Evolución contagios Covid-19", subtitle = "De enero a junio (2020)", caption = "Elaboración propia", x = NULL, y = "Nº casos al día") +  theme_bw() + theme(axis.text.x=element_blank(), axis.ticks.x=element_blank())  +  theme(plot.title = element_text(hjust = 0.5)) + theme(plot.subtitle = element_text(hjust = 0.5))

library(plotly)
```


```{r out.width="100%", out.height="50%", echo=FALSE, eval=TRUE}
ggplotly(g6)
```

<style>
div.blue { background-color:#b1ffa3; border-radius: 5px; padding: 20px;}
</style>
<div class = "blue">

**Interpretación del gráfico**
En este se muestra la evolución de los contagios por Covid-19 en España durante los 6 primeros meses,los datos van concretamente desde el 23 de enero hasta el 30 de junio,  además se observan 6 colores diferentes, correspondientes a los (6) meses. 
Esta representado de la siguiente manera: En el eje de las ordenadas se meustra el número de casos al día y en el de las abcisas un "ranking", este corresponde a la fila de la tabla representada arriba, en la variable "orden".

**Ejemplo**: __Ranking 59, contagios al día: 3394 y mes 03.__ Para ver a que día corresponde este valor iriamos a la [Tabla Resumen] y vemos que corresponde con el día 22 (de marzo) Además, obtenemos otros datos como el número de confirmados totales hasta ese día, recuperados o muertes.

</div>

<br>
Asimismo, cabe hacer una interpretación de los resultados obtenidos de manera que, como podemos observar en el gráfico el aumento en el mes de Marzo es increíble pasando de los 0 casos a cerca de 10000 positivos en un solo día, a raíz de este aumento tan marcado, el gobierno decidió aplicar un conjunto de medidas entre las que estaba el confinamiento domiciliario para toda la población y que como podemos observar tuvo bastante efecto, ya que el número de contagios descendió de manera considerable en Abril. Es cierto, no obstante, que en este mismo mes se dieron diversos picos de contagios pero la tendencia a partir de este mes, Abril, fue la reducción de los casos, acabándose de confirmar con la tendencia en Mayo y en Junio  obteniendo valores de contagios muy reducidos en comparación con meses previos. 

### 6.2 Saturación del sistema sanitario español

En este apartado se analizará la **evolución** de los **pacientes  ingresados por Covid durante las últimas 24 horas en los meses de septiembre-octubre y noviembre**. Así como los dados de alta al día, también durante estos meses.

```{r}
datos_CCAA <- datos_CCAA %>%
  relocate(Año, .after=Dia) %>%
  relocate(Mes, .after=Dia)

datos_Esp <- datos_CCAA %>%
  filter(cod_ine == 0) %>%
  relocate(cod_ine, .before=Dia)  #Datos para España.

datos_CV <- datos_CCAA %>%
  filter(cod_ine == 10) %>%
  relocate(cod_ine, .before=Dia) #Datos para la Comunitat Valenciana.

datos_Esp_S_N <- datos_Esp %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_CV_S_N<- datos_CV %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_Esp_N <- datos_Esp %>% filter(Mes == "11")
```

**EVOLUCIÓN DE LOS PACIENTES INGRESADOS POR COVID-19**
```{r}
grafico_1 <- ggplot(datos_Esp_S_N , aes(Dia , `Total Pacientes COVID ingresados`, group=Mes, color= Mes))  + geom_line() + labs(title = " Evolución de pacientes ingresados por covid en España", subtitle = "Desde el 1 Septiembre hasta Noviembre 30", caption = "Datos repositorio COVID19")
```

```{r out.width="70%", echo=FALSE, eval = TRUE}
grafico_1
```

En el anterior gráfico vemos tres líneas que muestran los datos referentes a los pacientes ingresados por Covid-19 en España en los meses de Septiembre(09) Octubre(10) y Noviembre(11). 

Estos meses agrupan lo que ha sido la **segunda ola**. Dado que observamos un aumento mantenido en Septiembre (del nivel de ingreso hospitalario por Covid), que a mediados de Octubre aumenta de manera muy pronunciada, casi duplicando la que había al principio del mes. En Noviembre, representado por la línea azul, observamos que primeramente los ingresos continúan aumentando, pero a vemos que la tendencia a partir del día 10 empiezan a disminuir, pasando de un máximo de mas de 20000 a menos de 15000 en a penas 15 días. Y situandose a finales de mes, en un nivel más bajo que los ingresados que habían en estos días un mes antes, en octubre.

```{r}
grafico_a <- ggplot(datos_Esp_N, aes(Dia, `Altas Ult24h`,   fill = Mes )) +  scale_fill_brewer(palette="Spectral") + geom_bar(stat = "identity")+ 
  labs(title = "Número de pacientes dados de alta por COVID en España al día", subtitle = "Mes Noviembre", caption = "Elaboración propia a partir de datos COVID19") + theme(legend.position = "none")


grafico_ap <- grafico_a + 
  geom_text(aes(y=`Altas Ult24h`, 
    label = `Altas Ult24h`), position = position_dodge(width = 0.8), 
    size = 3.2, vjust=3, col = "Black")
```


```{r out.width="70%", echo = FALSE, eval= TRUE}
grafico_ap
```

Durante el mes de Noviembre vemos que el numero de pacientes dados de alta es bastante elevado, los días que la cifra se reduce coincide con los Domingos de cada mes, dado que estos días, por lo general, el número de altas suele ser menor.
Además al venir de una situación de muchos positivos no es de extrañar que el número de altas ronde una cifra de 2000 altas diarias.

```{r}
#Preparamos los datos para hacer una TABLA
datos_CCAA_S_N <- datos_CCAA %>% filter (Mes == "09"| Mes == "10"| Mes == "11")

datos_CCAA_yaltas <- datos_CCAA_S_N %>% mutate(`%Altas por ingresados`  = (`Altas Ult24h`/ `Total Pacientes COVID ingresados`)* 100)

datos_CCAA_yaltas <- datos_CCAA_yaltas %>% select(Dia, Mes, CCAA, `Total Pacientes COVID ingresados`, `% Camas Ocupadas COVID`, `Total pacientes COVID en UCI`, `%Altas por ingresados`)
```

```{r echo = FALSE, eval = TRUE}

DT::datatable(datos_CCAA_yaltas, filter = 'top',
              options = list(pageLength = 10 , autoWidth = TRUE ))
```

### 6.3 Pruebas realizadas en las CCAA

**¿Cuántas PCR's se han hecho por cada mil habitantes?**

Corresponden a los últimos datos disponibles.
Asimismo, las Comunidades Autónomas con un mayor tamaño, son aquellas en las que se realizaron más pruebas por cada 100mil habitantes. (Los datos son acumulados)

```{r  out.width = "60%"}
library(wordcloud2)

dfCCAAp <- dfCCAA %>% select(dia, mes, CCAA, PCR_x_1000hab.) %>% filter(dia == "5") %>% filter(mes == "11") %>% arrange(desc(PCR_x_1000hab.))
dfCCAAp <- dfCCAAp %>% select(CCAA, PCR_x_1000hab.)

wordcloud2(data = dfCCAAp, size = 0.4)
```

Ahora vamos a verlo mediante gráficos, así podremos ver las PCR's acumuladas en total y las realizadas para cada 1000habitantes. 

```{r}
PruebasP <- ggplot(dfCCAA, aes(mes, PCR_x_1000hab., fill = CCAA)) + geom_col(position = "dodge")

PCRs <- PruebasP +  facet_wrap(vars(CCAA)) + labs(x = "Mes", y = "Núm. pruebas PCR", title = "PCR's al mes por cada mil hab.", caption = "Datos obtenidos de Datadista")  + theme_bw() + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))
```

```{r}
graficoB <- ggplot(dfCCAA, aes(mes, PCR, fill = CCAA)) + geom_col(position = "dodge")

b <- graficoB +  facet_wrap(vars(CCAA)) + labs(x = "Mes", y = "Núm. pruebas PCR", title = "PCR's mensuales") + theme_bw() + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))
#Ahora con el paquete patchwork juntamos los dos gráficos
```

```{r echo=FALSE, eval=TRUE, out.width="90%"}
b + PCRs
```

En este caso hemos ajustadao la escala de x para que coincida en todas las CCAA, por lo que en Ceuta y Melilla no se ven los datos en el gráfico de la izquierda, no porque no haya valores, sino porque las pruebas hechas en estas ciudades autónomas son prácticamente insignificante si se comparan con otras CCAA. En cambio, al poner el número de pruebas por cada mil habitantes, si se observan los datos, ya que hemos cogido un rango menor.

Este conjunto de gráficos nos muestra, por un lado, el número de PCR’s que se han realizado en cada comunidad autónoma en cada mes; y la otra, nos muestra el número de PCR’s por cada mil habitantes.

Si miramos la tabla de la cantidad de PCR’s realizadas, en primer lugar, se observa claramente como la cantidad pruebas realizadas en la “segunda ola” (en los últimos meses del año) es mucho mayor que el número de pruebas realizadas en la primera. Esto se debe a que, en la primera ola, el virus llegó cuando nadie lo esperaba, y la cantidad de recursos estaba muy limitado, es más, el sistema sanitario se colapsó.

También, debemos destacar que el número de pruebas realizadas en las comunidades de Madrid, Cataluña y Andalucía es mayor que las realizadas en el resto de CCAA. Cabe recalcar que la población de dichas comunidades es mucho mayor.

No obstante, si observamos el segundo conjunto de gráficos, la cantidad de pruebas realizadas en relación a la cantidad de habitantes que hay en cada comunidad, se iguala mucho más. En la “primera ola” la cantidad de pruebas están bastante igualadas en la mayoría de CCAA, sin embargo, donde se muestran más diferencias es en la “segunda ola”.

En la “segunda ola” Madrid ya no tiene unos datos tan escandalosos, los datos de Navarra y La Rioja se disparan. Por otro lado, también destacan otras comunidades como Aragón, Cantabria, Cataluña y Asturias. Las Comunidades con menos pruebas realizadas, serían Andalucía (el número de pruebas es altísimo pero comparado con su población es bajo), Valencia o Canarias. 



```{r}
C_M <- dfCCAA %>% filter(CCAA %in% c("Melilla", "Ceuta"))
C_M <- C_M %>% select(dia, mes, año, CCAA, PCR, TEST_ANTICUERPOS)
C_M <- C_M %>% pivot_longer(5:6, names_to = "Prueba", values_to= "N.prueba")

CeuMel <- C_M %>% group_by(CCAA, mes, Prueba) %>% summarise(Total = sum(N.prueba)) %>% filter(Prueba == "PCR") %>% filter(mes != "11")


graficoC_M <- ggplot(CeuMel, aes(mes, Total, fill = CCAA)) + scale_fill_brewer(palette = "Reds") + geom_col(position = "dodge") + labs(x = "Meses", y = "Núm. pruebas PCR", title = "PCR's mensuales Ceuta y Melilla") + theme_bw() + theme(plot.title = element_text(hjust = 0.5))
```

```{r out.width="80%", out.height="90%"}
library(plotly)
ggplotly(graficoC_M)
```

Si dejaramos las escalas libres para Ceuta y Melilla, vemos como el nivel de PCR's ha incrementado a lo largo de los meses, de marzo ha octubre hubo un aumento de 55.146 pruebas en Melilla, no obstante, en ambos gráficos estas ciudades autónomas presentan un número de pruebas bajo, cabe decir, no obstante, que el número de habitantes aquí es menor que en otras CCAA, por tanto, resulta lógico que las pruebas realizadas (sin tener en cuenta los datos relativos) sean menores.


### 6.4 Comparación, pruebas PCR y test anticuerpos

```{r pruebasCCAA}
dfb <- dfCCAA %>% select(dia, mes, año, cod_ine, CCAA, PCR, TEST_ANTICUERPOS)

Tpruebasl <- dfb %>% pivot_longer(cols = 6:7, names_to = "Prueba", values_to = "Total")

mediap <- Tpruebasl %>% group_by(Prueba) %>%  summarise(media = mean(Total))


grafico2 <- ggplot(mediap, aes(Prueba, media, fill = Prueba)) +  scale_fill_brewer(palette="Spectral") + geom_col() + labs(y = "Media pruebas",  title = "Comparación: Número de pruebas (totales) medias", caption = "Elaboración propia") + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + geom_text(aes(y=media, label = media), position = position_dodge(width = 0.8), size = 3.2, vjust=3, col = "Black") + xlab(NULL) +  theme_classic() + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5))
```

```{r echo=FALSE, eval=TRUE}
grafico2
```

A la vista del gráfico se comprueba como el número de PCRs es más significativo, se utiliza diariamente más que los tests rápidos, para detectar los positivos en Covid-19. 

Una de las causas principales de ello, es porque las PCR's ('Reacción en Cadena de la Polimerasa') son más fiables, permiten detectar y cuantificar el virus. Mientras que el test rápido sirve para detectar si la persona ha estado contagiada, en presencia o no de anticuerpos. 

```{r}
maxP <- dfCCAA %>% select(dia, mes, cod_ine, PCR) %>% filter(mes != "4")
maxp <- maxP %>% slice_max(PCR, n=1) #El dia que más pruebas PCR se hicieron fue el día 5 del 11 en Cataluña, concretamente se hicieron: 2.792.707
maxp <- maxp %>% rename(N.Pruebas = "PCR")
maxp <- maxp %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 2792707 ~ "PCR"))

#Haremos lo mismo para los otros tipos de prueba y para obtener el mínimo, por lo que creemos que el código no es necesario mostrarlo.
```

```{r echo=FALSE, eval=TRUE}
maxAC <- dfCCAA %>% select(dia, mes, cod_ine, TEST_ANTICUERPOS) %>% filter(mes != "4")

maxac <- maxAC %>% slice_max(TEST_ANTICUERPOS, n=1) #Máximo de pruebas de antigenos fue el día 5 del 11 en Andalucía con 490.969

maxac <- maxac %>% rename(N.Pruebas = "TEST_ANTICUERPOS")
maxac <- maxac %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 490969 ~ "TEST_ANTICUERPOS"))
```

```{r echo=FALSE, eval=TRUE}
maxO <-dfp %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes) %>% select(dia, mes, cod_ine, OTROS_TESTS) %>%  filter(mes != "4") %>% filter(cod_ine != "0")
maxo <- maxO %>% slice_max(OTROS_TESTS, n=1) #Máximo de "otras puebas"  fue el día 5 del 11 en Andalucía con 1.048.632

maxo <- maxo %>% rename(N.Pruebas = "OTROS_TESTS")
maxo <- maxo %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 1048632 ~ "OTROS_TESTS"))
```

```{r}
#PREPARACIÓN DE LAS TABLAS
#Juntar las tablas.
tabla <- rbind(maxo, maxac,maxp)

#Exporto esta tabla:
rio::export(tabla, here::here("datos", "tablamax.csv"))
tabla <- rio::import(here::here("datos", "tablamax.csv"))

tabla <- tabla %>% mutate(CCAA = case_when(cod_ine == 1 ~"Andalucia",   cod_ine == 9 ~ "Cataluña")) %>% select(dia, mes, CCAA, Tipo_Prueba, N.Pruebas)

#Repetimos todo el proceso para hacer el mínimo
```

```{r eval=TRUE, echo=FALSE}
minP <- dfCCAA %>% select(dia, mes, cod_ine, PCR) %>% filter(mes != "4")
minp <- minP %>% slice_min(PCR, n=1) #El dia que más pruebas PCR se hicieron fue el día 5 del 11 en Cataluña, concretamente se hicieron: 2.792.707
minp <- minp %>% rename(N.Pruebas = "PCR")

minp <- minp %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 649 ~ "PCR"))

minAC <- dfCCAA %>% select(dia, mes, cod_ine, TEST_ANTICUERPOS) %>% filter(mes != "4")

minac <- minAC %>% slice_min(TEST_ANTICUERPOS, n=1) #Máximo de pruebas de antigenos fue el día 5 del 11 en Andalucía con 490.969

minac <- minac %>% rename(N.Pruebas = "TEST_ANTICUERPOS")
minac <- minac %>% mutate(Tipo_Prueba =  case_when(N.Pruebas ==
1983 ~ "TEST_ANTICUERPOS"))

minO <-dfp %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes) %>% select(dia, mes, cod_ine, OTROS_TESTS) %>%  filter(mes != "4") %>% filter(cod_ine != "0")
mino <- minO %>% slice_min(OTROS_TESTS, n=1) #Máximo de "otras puebas"  fue el día 5 del 11 en Andalucía con 1.048.632

mino <- mino %>% rename(N.Pruebas = "OTROS_TESTS")
mino <- mino %>% mutate(Tipo_Prueba =  case_when(N.Pruebas == 0 ~ "OTROS_TESTS"))

```

```{r eval=TRUE, echo=FALSE}
tablamin <- rbind(mino, minac ,minp)

#Exporto esta tabla:
rio::export(tablamin, here::here("datos", "tablamix.csv"))
tablamin <- rio::import(here::here("datos", "tablamix.csv"))

tablamin <- tablamin %>% mutate(CCAA = case_when(cod_ine == 13 ~ "Madrid",  cod_ine == 9 ~ "Cataluña", cod_ine == 4 ~ "I.Baleares")) %>% select(dia, mes, CCAA, Tipo_Prueba, N.Pruebas)
```

```{r}
#Paso final para las tablas
library(flextable)

ftmin <- flextable(head(tablamin), col_keys = c("dia", "mes", "CCAA", "Tipo_Prueba", "N.Pruebas"))

ftmax <-  flextable(head(tabla), col_keys = c("dia", "mes", "CCAA", "Tipo_Prueba", "N.Pruebas"))
```

<br>

<center><FONT COLOR="Blue">**¿Cuál fue el día en el que menos pruebas se hicieron?**</FONT></center>
```{r echo=FALSE, eval=TRUE, out.width="80%"}
ftmin
```

<br>

<center><FONT COLOR="Blue">**Y, ¿Cuál fue el día en el que más pruebas se hicieron?**</FONT></center>

```{r echo=FALSE, eval=TRUE, out.width="80%"}
ftmax
```

<br>
*Cabe tener en cuenta que los datos van desde el 23 de marzo hasta el 5 de noviembre.

### 6.5 Análisis de casos según las **provincias**

```{r}
#Preparando los datos para que salga el mapa.
library(rio)
library(tidyverse)


Provincias <- rio::import("https://github.com/perezp44/LAU2boundaries4spain/blob/master/data/Provincias.rda?raw=true")


dfPROV <- dfPROV %>% mutate(Total_x_cap = Totalxcap*100)
dfPROV <- dfPROV %>% select(provincia, Cod, Poblacion, Total, Total_x_cap) %>% arrange(Cod)
#names(Provincias)


library(sf)

canarias <- Provincias %>% filter(INECodProv %in% c(35,38))

peninsula <- Provincias %>% filter( !(INECodProv %in% c(35, 38)))

my_shift <- st_bbox(peninsula)[c(1,2)]- (st_bbox(canarias)[c(1,2)]) + c(-2.4, -1.1)

canarias$geometry <- canarias$geometry + my_shift

st_crs(canarias)  <- st_crs(peninsula)

peninsula_y_canarias <- rbind(peninsula, canarias)



p <- ggplot(texto = "provincia" ) + geom_sf(data = peninsula_y_canarias)


Tabla <- full_join(peninsula_y_canarias, dfPROV, by = c("INECodProv" = "Cod"))


Tabla1 <- Tabla %>% select(provincia, INECodProv, Total_x_cap, geometry)

provincias_point <- st_centroid(Tabla1)
provincias_points <- cbind(Tabla1, st_coordinates(st_centroid(Tabla1$geometry)))


mapa <- p + geom_sf(data = peninsula_y_canarias, fill = NA) +
    geom_sf(data = provincias_points, aes(geometry = geometry, fill = Total_x_cap)) + scale_fill_viridis_c(direction = -1, option = "inferno", name = "Contagios x hab (%)", alpha = .6) + labs(title = "Contagios relativos según provincia y población") + theme(plot.title = element_text(hjust = 0.7, face = "bold", color = "Black")) + geom_text(data = provincias_points, aes(X, y=Y, label = provincia), color = "Black", fontface = "bold", check_overlap = TRUE, size = 2.5) +  theme_minimal() + theme(axis.text.x = element_blank(), axis.text.y = element_blank()) + labs(x = NULL, y=NULL)

```

```{r echo=FALSE, eval=TRUE, out.width="100%"}
mapa
```

## Es importante considerar los datos de manera relativa {.tabset}

### <FONT COLOR="FF4D00">**Provincias con más casos según población**</FONT>

```{r}
#Teniendo en cuenta la población:

dfTrelp <- dfTrel %>% mutate(Porcentaje = Totalxcap*100)


graficoB <- ggplot(dfTrelp, aes(forcats::fct_reorder(provincia, Porcentaje), Porcentaje)) +
  geom_col(aes(fill = Porcentaje)) +
  theme(axis.text.x = element_text(angle=90, vjust=0.6), panel.background = NULL) +
  scale_fill_viridis_c(option = "inferno", name = "Contagios per capita", alpha = 0.8, begin = 0.3, end = 0.7, direction = -1, guide = guide_colorbar( direction = "horizontal", barheight = unit(2, units = "mm"), barwidth = unit(50, units = "mm"), draw.ulim = F, title.position = 'top', title.hjust = 0.5, label.hjust = 0.5)) +
  theme(legend.text = element_text(size = 7)) +
  labs(title = "Contagios totales según provincia", subtitle = "Y en relación al número de habitantes") +
  theme(plot.title = element_text(hjust = 0.5)) +
  theme(plot.subtitle = element_text(hjust = 0.5)) + labs(x = NULL, y = NULL) + theme(legend.position = "bottom")
```

```{r echo=FALSE, eval=TRUE, out.width="80%"}
graficoB
```

### <FONT COLOR="FF4D00">**Treemapify**</FONT>

Si relacionamos el número de contagios totales por el número de habitantes; vemos que la provincia con más contagios es Navarra, seguida de Huesca y Burgos. Madrid sigue siendo una de las provincias cabeceras en cuanto a contagios.
Al contrario, las provincias que más destacan por menor número de casos son las provincias canarias Tenerife y Las Palmas.

```{r}
library(treemapify)

ggplot(dfTrelp, aes(area = Porcentaje, fill = Porcentaje, label = provincia)) +
  geom_treemap() +
  geom_treemap_text(fontface = "italic", colour = "white", place = "centre",
                    grow = FALSE) +
  scale_fill_viridis_c(option = "inferno", name = "", alpha = 0.8, begin = 0.3, end = 0.7, direction = -1,
                       guide = guide_colorbar( title = "% casos según población", direction = "horizontal", barheight = unit(2, units = "mm"),
                                               barwidth = unit(50, units = "mm"), draw.ulim = F,
                                               title.position = 'top', title.hjust = 0.5, label.hjust = 0.5)) +
  theme(legend.position = "bottom") + scale_x_continuous(labels=function(n){format(n, scientific = FALSE)}) +
  labs(title = "Provincias con mayor número de casos según su población (en %)",
       subtitle = "Se ha calculado el Total de casos entre la pobación y multiplicado por 100 para sacar el porcentaje",
       caption = "Los últimos datos corresponden al 11-11-2020") + theme(plot.title = element_text(hjust = 0.5)) +
  theme(plot.subtitle = element_text(hjust = 0.5))

```


### <FONT COLOR="FF4D00">**Una comparación**</FONT>

Dado que es importante tener en cuenta los casos de manera relativa, aquí hemos querido comparar el número de provincias con más casos teniendo en cuenta el número de habitantes que hay en cada una de estas y sin tener en cuenta la población. Como era esperable y a la vista del gráfico, observamos que resultados difieren al considerar o no la población

```{r}

dfM <- dfTrel %>% select(provincia, Total) %>% arrange(desc(Total))

dfM <- dfM %>% filter(provincia %in% c("Madrid", "Barcelona", "Murcia", "Sevilla", "Zaragoza"))

graficoA <- ggplot(dfM, aes(forcats::fct_reorder(provincia, Total), Total)) +
  geom_col(aes(fill = Total)) +
  theme(panel.background = NULL) +
  scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})

graficoA <- graficoA + geom_text(aes(y=Total, label = Total), position = position_dodge(width = 0.9), size = 3.2, vjust=2, col = "White") + labs(x = NULL, y = NULL, title = "5 provincias con más contagios totales") + theme(plot.title = element_text(hjust = 0.5))

dfMb <- dfTrel %>% select(provincia, Totalxcap) %>% arrange(desc(Totalxcap))

dfMb <- dfMb %>% filter(provincia %in% c("Navarra", "Huesca", "Burgos", "Valladolid", "Zaragoza"))

graficoA2 <- ggplot(dfMb, aes(forcats::fct_reorder(provincia, Totalxcap), Totalxcap)) +
  geom_col(aes(fill = Totalxcap)) +
  theme(panel.background = NULL) +
  scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})

graficoA2 <- graficoA2 + geom_text(aes(y=Totalxcap, label = Totalxcap), position = position_dodge(width = 0.3), size = 2, vjust=3, col = "White") + labs(x = NULL, y = NULL, title = "5 provincias con más contagios en función de la población") + theme(plot.title = element_text(hjust = 0.5))
```

```{r echo=FALSE, eval=TRUE, out.width="100%"}
library(patchwork)
graficoA / graficoA2
```

## 7. Estudio sobre el Covid en la **Comunidad Valenciana**

Siguiendo nuestro análisis sobre la Covid-19, en este apartado nos centraremos en analizar algunos elementos destaclabes de la pandemía en la Comunidad Valenciana.

### 7.1 Contagios en la Comunidad Valenciana.

  ```{r echo=FALSE, eval=FALSE}
dfCV <- dfrel %>% filter(provincia %in% c("Valencia", "Alicante", "Castellon"))
```

```{r, echo=FALSE, eval=FALSE}
graficoCV <- ggplot(dfCV, aes(mes, Total_cap, color = provincia)) + geom_line() + geom_point() + theme_light() + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)}) + labs(title = "Ev. contagios Com.Valenciana en función de sus habitantes", caption = "Datos del Instituto de Salud Carlos III", x = "Meses", y = "Contagios per capita") +  theme(plot.title = element_text(hjust = 0.5, face = "bold", color = "Coral")) + scale_x_continuous(breaks = seq(0, 12, 1))
ggplotly(graficoCV)
```

```{r out.width="90%"}

dfrelb <- dfgg %>% mutate(Total_cap = (Num/Poblacion))

dfTrelx <- dfrelb %>% mutate(Totalxcap = (Total_cap*100)) %>% filter(provincia %in% c("Castellon", "Valencia", "Alicante"))

dfTrelx <- transform(dfTrelx, mes = as.numeric(mes))

a <- ggplot(data = dfTrelx, aes(mes, Num, group=provincia, color = provincia)) + geom_line() + geom_point() + theme_minimal()   + labs(y= "Número de contagios", y = "Meses", caption = "Elaboración propia") + theme(plot.title = element_text(hjust = 0.5)) + scale_x_continuous(breaks = seq(1, 11, 1))

a + transition_reveal(mes) + labs(title="NÚMERO DE CASOS EN LA COMUNIDAD VALENCIANA. Mes: {as.integer(frame_along)}")
```

Centrándonos en las provincias de la Comunidad Valenciana, se puede observar que Alicante es la que menos Contagios tiene de las tres, luego iría Castellón y Valencia. Pero las tres, tienen una buena tasa de contagios respecto al resto de provincias, ya que están entre las 11 provincias con menos contagios de toda España. 

### 7.2 Ingresados en Sept-Oct-Nov por Covid. 

```{r}
datos_CV <- datos_CCAA %>%
filter(cod_ine == 10) %>%
relocate(cod_ine, .before=Dia) #Datos para la Comunitat Valenciana.
datos_CV_S_N<- datos_CV %>% filter (Mes == "09"| Mes == "10"| Mes == "11")
grafico_CV <- ggplot(datos_CV_S_N , aes(Dia , `Total Pacientes COVID ingresados`, group=Mes, color= Mes))  + geom_line() + labs(title = " Evolución de pacientes ingresados por covid en la Comunidad Valenciana", subtitle = "Desde el 1 Septiembre hasta Noviembre 30", caption = "Datos repositorio COVID19")
grafico_CV
```

```{r echo=FALSE, eval=FALSE}
grafico_b <- ggplot(datos_CV_S_N, aes(Dia, `Altas Ult24h`,   fill = Mes )) +  geom_bar(stat = "identity")+ labs(title = "Número de pacientes dados de alta por COVID en la Comunidad Valenciana al día")+ labs(subtitle = "Desde el 1 Septiembre hasta Noviembre 30")

library(plotly)
ggplotly(grafico_b)
#Lo ocultamos porque no nos gusta como queda.
```

La evolución de los pacientes ingresados por COVID en la segunda ola, han evolucionado de manera similar a la evolución de contagios.

Podemos ver, como en septiembre el número de pacientes estaba bastante controlado, pero cuando llegó el mes de octubre, fue cuando los hospitales sufrieron un repunte total de los pacientes ingresados, que durante el mes de noviembre aumentó todavía más si cabe.

En noviembre los datos se volvieron altamente peligrosos, ya que los hospitales de la Comunidad estaban cerca de colapsarse como ya sucedió en la primera ola. 

La cresta de esta ola, llegó el 18 de noviembre donde habían más de 1800 ingresados por coronavirus en la Comunidad Valenciana.

## Pruebas realizadas {.tabset}

### <FONT COLOR="FF4D00">**Tipos de pruebas**</FONT>

<br>

La prueba más repetida en nuestra comunidad es sin ninguna duda, la prueba PCR, seguida de la prueba de anticuerpos. En todos los meses recogidos, la cantidad de pruebas PCR es muy superior a la cantidad del resto de pruebas.

También podemos ver, que el en el mes de septiembre se han realizado más pruebas que en los meses de julio y agosto.
Cabe destacar que, en el mes de julio, se realizaron más pruebas de anticuerpos que en el resto de los meses. 

Por último, se ve una clara evolución al alza de otros tests, esto se da gracias a que la prueba de antígenos cada vez es más común debido a su eficacia y a que la realización de ella es mucho más barata que las PCR.

```{r}
cv <- dfp %>% filter(CCAA == "Comunidad Valenciana")
cv  <- cv %>%
  separate(Fecha, c("año","mes","dia"), sep = "-") %>%                 relocate(año, .after=dia) %>%
  relocate(dia, .before =mes)


cv <- cv %>% filter (mes == "07"| mes == "08"| mes == "09") %>% select(dia, mes, PCR, TEST_ANTICUERPOS, OTROS_TESTS)

cvl <- cv %>% pivot_longer(3:5, names_to = "Pruebas", values_to = "N.prueba")

#Para calcular en la Comunidad Valenciana que tipo de pruebas se han hecho más durante los meses de julio, agosto y septiembre.

Csep <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "09")

S <- ggplot(Csep, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="septiembre") + theme(plot.title = element_text(hjust = 0.5))
#Igual para julio y agosto
```

```{r}

Cjul <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "07")

J <- ggplot(Cjul, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="julio") + theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "none")

Cagost <- cvl %>% group_by(mes, Pruebas) %>% summarise(Total = sum(N.prueba)) %>% filter(mes == "08")

A <- ggplot(Cagost, aes("", Total, fill = Pruebas)) + geom_bar(stat = "identity", color="white") + geom_text(aes(label=Total), position = position_stack(vjust=0.5), color = "white", size = 2) + coord_polar(theta = "y") + scale_fill_manual(values=c("salmon","steelblue","orange","gray")) + theme_void() + labs(title="agosto") + theme(plot.title = element_text(hjust = 0.5)) + theme(legend.position = "none")
```

```{r echo=FALSE, eval=TRUE, out.width="80%"}
library(patchwork)
J +  A + S
```

### <FONT COLOR="FF4D00">**PCR's según  mes**</FONT>

```{r}

C_V <- dfCCAA %>% filter(CCAA == "C.Valenciana")
C_V <- C_V %>% select(dia, mes, año, CCAA, PCR, TEST_ANTICUERPOS)
C_V <- C_V %>% pivot_longer(5:6, names_to = "Prueba", values_to= "N.prueba")

CVlcna <- C_V %>% group_by(mes, Prueba) %>% summarise(Total = sum(N.prueba)) %>% filter(Prueba == "PCR") %>% filter(mes != "11")

graficoC_V <- ggplot(CVlcna, aes(mes, Total, fill = "Orange"))  + geom_col(position = "dodge") + labs(x = "Meses", y = "Núm. pruebas PCR", title = "PCR's mensuales C.Valenciana", subtitle =  "Meses abril-octubre") + theme_bw() + theme(plot.title = element_text(hjust = 0.5)) + theme(plot.subtitle = element_text(hjust = 0.5)) + theme(legend.position = "none") + theme(plot.title = element_text(hjust = 0.5)) + scale_y_continuous(labels=function(n){format(n, scientific = FALSE)})
```

```{r echo=FALSE, eval=TRUE, out.width="75%"}
library(plotly)
ggplotly(graficoC_V, tooltip = c("mes", "Total"), width= 450)
```
En este gráfico se muestran las PCR's **acumuladas**

La evolución mensual de PCR’s en la Comunidad Valenciana, demuestra que la cantidad de pruebas realizadas en la segunda ola, es mucho mayor que en la primera; esto se debe a que en la primera ola estábamos escasos de recursos. 


```{r echo=TRUE, eval=FALSE}
#Hemos hecho este gráfico pero no sale cuando le damos a Knit.
library(highcharter)

C_vf <- C_V %>% filter(mes != "11") %>% filter(mes != "4")  %>% group_by(mes, Prueba) %>% summarise(Total = sum(N.prueba))

hchart(C_vf, "column", hcaes(x = mes, y = Total, group = Prueba))  %>%  hc_add_theme(hc_theme_gridlight())  %>%   hc_title(
    text = "<b>NÚMERO DE PRUEBAS SEGÚN TESTS Y MESES EN LA COMUNIDAD VALENCIANA </b>",
    margin = 20,
    align = "center",
    style = list(color = "#22A884"))

#*Los valores de este gráfico son la suma total de las pruebas realizadas en un mes concreto, los datos ofrecidos mostraban las pruebas realizadas por semanas durante cada mes.
```


## 8. Algunas cuestiones sobre el impacto económico {.tabset}

### <FONT COLOR="FF4D00">**¿Qué cuestiones?**</FONT>

Por último, en este apartado nos gustaría comentar cual ha sido el efecto de la Covid-19, en algunos ámbitos económicos, en concreto, como ha afectado al mercado de trabajo, al desempleo, en diferentes países europeos. Además de algunas cuestiones sobre el PIB, el cual, como era de esperar ha bajado ddebido a la actual crisis sanitaria.  

Para mostrar esto, hemos cogido datos del Eurostat. Este BREVE análisis se dividirá en:

- Primeramente un mapa con el % de parados que había en los diferentes países de la Unión Europea, durante el mes de abril, en plena pandemia (y confinamineto de muchos de estos países)

- Seguidamente compararemos en los diferentes meses como ha evolucionado el paro en 5 países europeos, estos son: Francia, Portugal, Italia, España y como curiosidad, Suecia, ya que es el único país europeo en el que no habido un confinamiento estricto. 

- Por último, centrados en España, podremos observar como el paro ha afectado ha afectado de manera diferente dependiendo del género. Presentando un % de paro mayor las muejeres que los hombres. 

En cuanto al PIB, considerando el año base en 2015, pretendemos ver el efecto para Francia, Italia, España y Suecia del:

- PIB a precios de mercado.
- Exportaciones de bienes y servicios.
- Importaciones de bienes y servicios.


### <FONT COLOR="FF4D00">**DESEMPLEO**</FONT>

Con el fin de analizar la situación del mercado laboral tras la crisi del Covid, hemos hecho una serie de mapas-gráficos.

A través del mapa, observamos que en el mes de Abril la tasa armonizada de paro en España se situaba en valores entre 14,3-16,4. Cifras solo superadas por Grecia.

No obstante, cabe destacar que esto no es una situación nueva, es decir, las cifras de paro en España ya eran elevadas antes de la pandemia, al igual que en Grecia, Por lo tanto, no observamos a corto plazo cambios muy significativos entre la proporción de la población ocupada y la desocupada (Población Activa)

En el siguiente gráfico se muestra la evolución de la tasa de paro armonizada para 5 países (España, Francia, Italia, Portugal y Suecia)

Como vemos, la tendencia aunque no muy pronunciada es clara, a excepción de Italia. Aquí primero parece disminuir la tasa de paro y a partir de abril cambia de tendencia y empieza a aumentar. 

En cambio, los demás países analizados y sobretodo en España la tasa de paro aumenta tras la crisis sanitaria. Pasando, por ejemplo, en España de 13,7% en diciembre de 2019 a 16,2% en noviembre de 2020, pasando por un máximo de 16,9% en julio. 

En el último gráfico se muestra como ha afectado en España la tasa de paro en función del género, donde podemos concluir que hay más % de mujeres desempleadas que de hombres.

Finalmente, decir que esta crisis no ha afectado de igual manera que la recesión de 2008,  además de que muchas empresas han tenido que aplicar el ERTE a sus trabajadores y el gobierno ha tenido que adoptar nuevas medidas en torno a esto. [^5]



```{r echo=FALSE, eval=TRUE}
library(eurostat)
library(tidyverse)

#Probando a a
mapdata_0 <- get_eurostat_geospatial(nuts_level = 0)
m <- mapdata_0 %>%
  ggplot(., aes()) +
  geom_sf(fill="green", color="black", size = 0.1) +
  theme_minimal() +
  xlim(c(-30, 44)) +
  ylim(c(35, 75))
```

```{r}
#PREPARANDO LOS DATOS
paro <- search_eurostat(pattern = "unemployment",
                             type = "table")

#Hay datos hasta 2020M11, es decir, hasta el mes de noviembre de este año, 2020.

inf_paro <- get_eurostat(id= "teilm020",  time_format = "num")

labelE <- label_eurostat(inf_paro)

country_codes <- unique(mapdata_0$NUTS_ID)

#2020.25 corresponde al año 2020 mes 04 (abril)
inf_paro_2020 <- inf_paro %>%
  filter( time == "2020.25") %>%
  filter(geo %in% country_codes)

inf_paro_2020_mapa <- mapdata_0 %>%
  right_join(inf_paro_2020) %>%
  mutate(cat = cut_to_classes(values, n=8, decimals = 1))
```

 **Mapa de coropletas para el paro**


```{r out.width="85%"}
#CODIGO PARA EL MAPA

ggplot(inf_paro_2020_mapa, aes(fill=cat)) +
  geom_sf(color = alpha("white", 1/2), alpha= .9) +
  xlim(c(-20, 44)) +
  ylim(c(35, 70)) +
  labs(title = "Tasa armonizada de paro (%)",
       subtitle = "Abril 2020",
       caption = "(C) EuroGeographics for the administrative boundaries",
       fill= "") +
  theme_classic() +
  theme(
    axis.line = element_blank(),
    axis.text = element_blank(),
    axis.title = element_blank(),
    axis.ticks = element_blank(),
    plot.background = element_rect(fill = "snow", color = NA),
    panel.background = element_rect(fill= "snow", color = NA),
    plot.title = element_text(size = 18, hjust = 0.5),
    plot.subtitle = element_text(size = 12, hjust = 0.5),
    plot.caption = element_text(size = 8, hjust = 1),
    legend.title = element_text(color = "grey40", size = 8),
    legend.text = element_text(color = "grey40", size = 7, hjust = 0),
    legend.position = c(0.93, 0.6),
    plot.margin = unit(c(0.5,2,0.5,1), "cm")) +
  scale_fill_brewer(palette= "Paired")
```


**Evolución del paro**

```{r}
#PREPARANDO LOS DATOS
#La tasa de paro de España en el mes de abril fue del 15%

#En cambio, en el mes de enero, antes de comenzar la pandemia era de 13.5

#Filtramos para comparar España, Francia, Italia, Portugal y Suiza

Filtros <- inf_paro %>% filter(geo %in% c("ES", "PT", "IT", "FR", "SE"))
Filtros <- Filtros %>% filter(sex == "T")

library(plotly)

Evparo <- ggplot(Filtros, aes(time, values, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (en %)", title = "Evolución de la tasa de paro armonizada (en %)",
subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde diciembre 2019 hasta octubre 2020.
(Cada punto del gráfico indica un mes)") +
theme_light() +
theme(plot.title = element_text(size = 18, hjust = 0.5),
plot.subtitle = element_text(size = 12, hjust = 0.5),
plot.caption = element_text(size = 8, hjust = 1)) +
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank())

Evparo <- Evparo + scale_y_continuous(breaks = seq(2, 17, 1))
```

```{r echo=FALSE, eval=TRUE}
ggplotly(Evparo, tooltip = c("geo", "values"), width= 850)
```

**Paro en España, a qué genero ha afectado más?**

```{r}
#Como ha afectado el paro dependiendo del sexo?

Spain <- inf_paro %>% filter(geo == "ES")
Spain <- Spain %>% filter(sex %in% c("M", "F"))


GraficoSpain <- ggplot(Spain, aes(time, values, color = sex)) +
  geom_line(size = 1) +
  geom_point() +
  labs(y = "Valor (en %)",
       title = "Evolución tasa de paro armonizada para España (en %)",
 subtitle = "Diferenciando por sexo: femenino y masculino", caption ="Datos Eurostat.
Los datos van desde diciembre 2019 hasta octubre 2020.
(Cada punto del gráfico indica un mes)") +
  theme_minimal() +
  theme(plot.title = element_text(size = 18, hjust = 0.5),
        plot.subtitle = element_text(size = 12, hjust = 0.5),
        plot.caption = element_text(size = 8, hjust = 1)) +
  theme(axis.title.x=element_blank(),
        axis.text.x=element_blank(),
        axis.ticks.x=element_blank()) +
  theme(legend.position = "bottom") +
 theme(legend.direction = "horizontal")
```

```{r echo=FALSE, eval=TRUE, out.width="85%"}
library(ggThemeAssist)
GraficoSpain + theme( 
    plot.title = element_text(colour = "coral2"), 
    legend.title = element_text(size = 11, 
        colour = "aquamarine4"), panel.background = element_rect(fill = NA), 
    plot.background = element_rect(fill = "aliceblue", 
        colour = NA), legend.background = element_rect(fill = "aliceblue"))
```

### <FONT COLOR="FF4D00">**PIB**</FONT>

```{r}
#Datos del paquete Eurostat:
library(tidyverse)

library(eurostat)

gdp <- get_eurostat("namq_10_gdp", time_format = "raw", keepFlags = TRUE)

labelgdp <- label_eurostat(gdp, fix_duplicated = TRUE)
df_names <- names(gdp)

df <- label_eurostat(gdp, code = df_names, fix_duplicated = TRUE)

df <- df %>%
    select(unit_code, s_adj_code, na_item_code, geo, geo_code, time, values)

#df_bb <- pjpv2020.01::pjp_f_unique_values(df, truncate = TRUE, nn_truncate = 200)

df <- df %>% filter(time >= "2018Q1")
gdp <- df


gdp<- gdp %>% rename (unidad_de_medida =na_item_code)

# a) Gross domestic product at market prices
gdp_a <-  gdp  %>% filter(unidad_de_medida== "B1GQ") %>% select(-unidad_de_medida)

gdp_a <- gdp_a %>% filter(unit_code == "CLV_I15") %>% filter(s_adj_code == "SCA")

gdp_a <- gdp_a %>% select(-c(unit_code,s_adj_code))
#Lo mismo para las exportaciones y las importaciones

```

```{r echo=FALSE, eval=TRUE}
#b)Export of goods and services.
gdp_b <- gdp  %>% filter(unidad_de_medida== "P6") %>% filter(unit_code == "CLV_I15") %>% filter(s_adj_code == "SCA")

gdp_b <- gdp_b %>% select(-c(unit_code,s_adj_code))
gdp_b <- gdp_b %>% select(-unidad_de_medida)

#c)Imports of good and services.

gdp_c <-  gdp  %>% filter(unidad_de_medida== "P7") %>% filter(unit_code == "CLV_I15") %>% filter(s_adj_code == "SCA")

gdp_c <- gdp_c %>% select(-c(unit_code,s_adj_code))
gdp_c <- gdp_c %>% select(-unidad_de_medida)

#d)Gross fixed capital formation
gdp_d<- gdp  %>% filter(unidad_de_medida== "P51G") %>% filter(s_adj_code == "SCA") %>% filter(unit_code == "CLV_I15")

gdp_d <- gdp_d %>% select(-c(unit_code,s_adj_code))
gdp_d <- gdp_d %>% select(-unidad_de_medida)


#seleccionamos Francia Italia España y SUecia

gdp_pa<- gdp_a %>%  filter (geo=="Italy"|geo=="Sweden"|geo=="France"|geo=="Spain" )
gdp_pb<- gdp_b %>%  filter (geo=="Italy"|geo=="Sweden"|geo=="France"|geo=="Spain" )
gdp_pc<- gdp_c %>%  filter (geo=="Italy"|geo=="Sweden"|geo=="France"|geo=="Spain" )

```

```{r}
library(plotly)

Evgdpa <- ggplot(gdp_pa, aes(time, values,group=geo, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (Índices)", title = "Evolución del PIB a precios de mercado (Año base 2015)",
                                                                                                      subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde el primer trimestre de 2018 hasta el tercer trimestre del 2020.
(Cada punto del gráfico indica un trimestre)") +
    theme_light() +
    theme(plot.title = element_text(size = 18, hjust = 0.5),
          plot.subtitle = element_text(size = 12, hjust = 0.5),
          plot.caption = element_text(size = 8, hjust = 1)) +
    theme(axis.title.x=element_blank(),
          axis.text.x=element_blank())


#ggplotly(Evgdpa, tooltip = c("geo", "values"))
``` 


```{r echo=FALSE, eval=TRUE}
Evgdpb <- ggplot(gdp_pb, aes(time, values,group=geo, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (Índices)", title = "Evol.   export. de bienes y servicios (A. base 2015)",subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde el primer trimestre de 2018 hasta el tercer trimestre del 2020.
(Cada punto del gráfico indica un trimestre)") +
    theme_light() +
    theme(plot.title = element_text(size = 18, hjust = 0.5),
          plot.subtitle = element_text(size = 12, hjust = 0.5),
          plot.caption = element_text(size = 8, hjust = 1)) +
    theme(axis.title.x=element_blank(),
          axis.text.x=element_blank())


#ggplotly(Evgdpb, tooltip = c("geo", "values"))


Evgdpc <- ggplot(gdp_pa, aes(time, values,group=geo, color = geo)) + geom_line(size = 1) + geom_point() + labs(y = "Valor (en índices)", title = "Evol. imp  bienes y servicios (A.base 2015)",
                                                                                                               subtitle = "PAÍSES: España, Francia, Italia, Portugal, Suecia", caption ="Datos Eurostat.
Los datos van desde el primer trimestre de 2018 hasta el tercer trimestre del 2020.
(Cada punto del gráfico indica un trimestre)") +
    theme_light() +
    theme(plot.title = element_text(size = 18, hjust = 0.5),
          plot.subtitle = element_text(size = 12, hjust = 0.5),
          plot.caption = element_text(size = 8, hjust = 1)) +
    theme(axis.title.x=element_blank(),
          axis.text.x=element_blank())

#ggplotly(Evgdpc, tooltip = c("geo", "values"))
```

```{r echo=FALSE, eval=TRUE, out.width="90%"}
library(gridExtra)  #- install.packages("gridExtra")

grid.arrange(Evgdpa, Evgdpb,Evgdpc, nrow= 3)
```


<br>

En estos tres gráficos queremos ofrecer una perspectiva económica de cuál ha sido el  impacto del coronavirus en cuatro países europeos, algunos de los cuales ofrecen diferencias destacables en cuanto a su estructura o composición económica De manera que en estos gráficos se muestra tanto la evolución del PIB a precios de mercado como las exportaciones e importaciones de bienes y servicios, todos ellos en números índices, cuyo año base es 2015 (2015 = 100)

Observando de forma global en los tres gráficos podemos ver que tanto Francia, España e Italia tienen una evolución muy parecida. En cambio, Suecia no sufre tan drásticamente los efectos negativos de la pandemia.

Esto se debe, en parte, a que Suecia no puso un confinamiento restrictivo, durante el primer pico de la pandemia, dado que la incidencia fue mucho menor que en los otros tres países analizados. Optó pues, por la estrategia de 'inmunidad de rebaño" Como resultado, observamos que las cifras de Suecia con mejores que la de otros países de la eurozona, el PIB no cayó tanto en el segundo y tercer trimestre de 2020, se encontraba alrededor de 105 pp. Mientras que en España bajó 15 puntos respecto a su año base.

Además, cabe decir que en el país escandinavo, la digitalización y el teletrabajo ya estaba presente en muchas empresas, a diferencia de otros países, como España, que pilló más de improvisto.

No obstante, sería interesante saber lo que proponen las diferentes autoridades responsables de la política económica para intentar devolver los actuales valores a las cifras que había antes del primer trimestre de 2020. Así como el efecto que tendrá la aplicación de la vacuna sobre las expectativas de la población.

## 9. Conclusión

El contar con una herramienta tan potente como es R, que nos permite manejar datos y utilizarlos para hacer análisis complejos nos ha permitido y facilitado tener una perspectiva más amplia y a la vez concreta de lo que está sucediendo con la actual pandemia de la Covid-19. Por lo que nuestro análisis se ha centrado en esta, tanto a nivel mundial como más concretamente para España y la Comunidad Valenciana. Así como hemos mostrado de manera breve cual ha sido el impacto económico que ha podido tener la pandemia a nivel europeo.


Cabe señalar que nos ha resultado muy interesante el hecho de poner manejar los datos a nuestro antojo para intentar resolver ciertas cuestiones que nos planteamos antes de empezar el análisis y así, ofrecer la información de forma más visual a través de gráficos, tablas, mapas y demás. Para obtener estos resultados, hemos tenido que seguir varios pasos, empezando por buscar los datos y hacerlos “tidy” (para utilizar aquello que realmente necesitábamos) Además, decir que existen diferentes paquetes (Covid19, TidyCovid19, ncov19…) que recopilan información sobre el Coronavirus y facilitan la creación de, por ejemplo, mapas.


Como indicamos en la introducción, elegimos el tema de la Covid-19 dado que queríamos entender por nuestro pie que era esto que había, prácticamente, paralizado el mundo. Por ello, en el presente informe hemos intentado mostrar curiosidades y datos, con el fin de tener una visión general de cómo ha sido el devenir de la pandemia y su evolución hasta prácticamente el mes de Diciembre. 


Por último, cabe comentar algunas cuestiones extraídas tras hacer el análisis. Así pues, es destacable que la segunda ola a nivel de contagios ha sido mucho mayor que la primera ola en la mayoría de países, todo y que gracias a la previa preparación, la saturación del sistema sanitario no ha llegado al nivel de la primera, donde hubo momentos en los que los hospitales parecían estar al borde del colapso. 


Asimismo, dado que creemos que para poder comparar los datos es mejor que sean relativos, para el caso de España hemos cogido la población de las provincias y así hemos podido calcular el % de contagios según la población. Además de, por ejemplo, las PCR’s por cada 100 mil habitantes, en las diferentes Comunidades Autónomas, donde destaca Navarra como la que más pruebas ha realizado. 


Finalmente decir que al tratarse de un tema actual los datos van evolucionando, cambiando. Por tanto, hay que fijarse en el periodo para el que está hecha cada una de las representaciones.


## Referencias

Las siguientes páginas web son las que hemos utilizado para la realización del trabajo:


- <a href="https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"/target="_blank">https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv</a>


- <a href= "https://datosmacro.expansion.com/otros/coronavirus/vanuatu
"/target="_blank">https://datosmacro.expansion.com/otros/coronavirus/vanuatu
</a>

- <a href="https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv"/target="_blank">https://raw.githubusercontent.com/datasets/covid-19/master/data/time-series-19-covid-combined.csv</a>


- <a href="https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv"/target="_blank">https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv</a>


- <a href="https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv"/target="_blank">https://github.com/datadista/datasets/blob/master/COVID%2019/ccaa_covid19_test_realizados.csv</a>


- <a href="https://github.com/joachim-gassen/tidycovid19."/target="_blank">https://github.com/joachim-gassen/tidycovid19.</a>


- <a href="https://github.com/perezp44/LAU2boundaries4spain/blob/master/data/Provincias.rda?raw=true"/target="_blank">https://github.com/perezp44/LAU2boundaries4spain/blob/master/data/Provincias.rda?raw=true</a>


- <a href="https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv"/target="_blank">https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv</a>


- <a href="https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv"/target="_blank">https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/ccaa_ingresos_camas_convencionales_uci.csv</a>


- <a href="https://bookdown.org/yihui/rmarkdown/learnr-start.html"/target="_blank">https://bookdown.org/yihui/rmarkdown/learnr-start.html</a>


- <a href="https://bookdown.org/yihui/rmarkdown/learnr-start.html"/target="_blank">https://bookdown.org/yihui/rmarkdown/learnr-start.html</a>


- <a href="https://rpubs.com/"/target="_blank">https://rpubs.com/</a>


- <a href="https://ugoproto.github.io/ugo_r_doc/pdf/gganimate.pdf"/target="_blank">https://ugoproto.github.io/ugo_r_doc/pdf/gganimate.pdf</a>


- <a href="https://www.highcharts.com/blog/tutorials/highcharts-for-r-users/"/target="_blank">https://www.highcharts.com/blog/tutorials/highcharts-for-r-users/</a>


- <a href="https://towardsdatascience.com/create-a-word-cloud-with-r-bde3e7422e8a"/target="_blank">https://towardsdatascience.com/create-a-word-cloud-with-r-bde3e7422e8a</a>


- <a href="https://www.r-bloggers.com/2020/04/tidycovid19-new-visualizations-and-data-on-lifting-of-governmental-measures/?fbclid=IwAR0zyKgZoKYPu0KXdOePT5oj8j5BTe7ilrj0phjZxURgNn-RdzaaXiVMOiE"/target="_blank">https://www.r-bloggers.com/2020/04/tidycovid19-new-visualizations-and-data-on-lifting-of-governmental-measures/?fbclid=IwAR0zyKgZoKYPu0KXdOePT5oj8j5BTe7ilrj0phjZxURgNn-RdzaaXiVMOiE</a>


-  <a href="https://estadisticamente.com/paletas-de-colores-en-r/"/target="_blank"/target="_blank">https://estadisticamente.com/paletas-de-colores-en-r/</a> 


-  <a href="https://mappinggis.com/2019/07/creacion-de-mapas-con-r-y-ggplot2/"/target="_blank">https://mappinggis.com/2019/07/creacion-de-mapas-con-r-y-ggplot2/</a> 

- <a href="https://gganimate.com/"/target="_blank">https://gganimate.com/</a> 

- <a href="https://gt.rstudio.com/"/target="_blank">https://gt.rstudio.com/</a> 
- <a href="https://datacy.es/blog/tablas-bonitas-en-r-si-es-posible/"/target="_blank">https://datacy.es/blog/tablas-bonitas-en-r-si-es-posible</a> 

- <a href=" https://rpubs.com/JonathanRzezak/652633
"/target="_blank">https://rpubs.com/JonathanRzezak/652633</a>  

- <a href="https://www.worldometers.info/coronavirus/"/target="_blank">Worldometers</a> 

- <a href="https://cnecovid.isciii.es/covid19/"/target="_blank">COVID ISCIII</a>  

Además de las páginas web mencionadas, hemos utilizado los tutoriales y slides del curso (link mencionado en: nota de página 1)

Asimismo, como comeNtabamos en la introducción nos hemos inspirado para hacer el presente trabajo en nuestro interés por investigar sobre este tema, el cual es actual, así como por la cantidad de datos y notícias que se transmiten día a día.

Igualmente, para hacer el informe y tener ejemplos (referencias) hemos acudido a los trabajos realizados por los compañeros que cursaron la asignatura el año pasado, los encontramos aquí: <https://github.com/perezp44/tutoriales_intro_DS>

----------------

<br>

Para acabar este chunk incluiremos la `session info`:

```{r}
sessioninfo::session_info() %>% details::details(summary = 'current session info') 
```

[^1]: Si quieres visitar la web del curso: <a href="https://perezp44.github.io/intro-ds-20-21-web/"target="_blank">https://perezp44.github.io/intro-ds-20-21-web/</a>

[^2]: Si quieres consultar más información haz click <a href="https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov/documentos/ITCoronavirus.pdf#:~:text=En%20este%20momento%20se%20desconoce,origen%20de%20la%20pandemia./"target="_blank"> aquí</a> 

[^3]: Indicamos el enlace por si se quiere obtener más información al respecto.<a href="https://data.humdata.org/dataset/acaps-covid19-government-measures-dataset"/target="_blank">https://data.humdata.org/dataset/acaps-covid19-government-measures-dataset</a>  

[^4]: No hemos hecho la evolución hasta la fecha actual, dado que a partir de julio los datos de contagios en fines de semana muestran unos valores de 0 (Un resultado no coherente)

[^5]: Aquí dejamos en elance por si se quiere consultar más inf. <a href="https://www.sepe.es/HomeSepe/COVID-19/nuevas-medidas-aplicacion-ERTE-COVID-19-Real-Decreto-ley-30-2020-29-septiembre.html"/target="_blank">SEPE</a>  
