Análisis de Componentes Principales

Autor/a

Juan Pablo Montaño Díaz & Laura Katherine Martinez Castiblanco

Para el desarrollo del análisis de componentes principales del conjunto de datos se utilizarán los paquetes de \(\texttt{FactoMineR,ade4,FactoClass}\) y \(\texttt{factoextra}\). Si bien puede ser redundante el uso de estos 4 paquetes en el mismo código, cada uno de estos ofrece funciones que nos ayudaran a dar una mejor representación gráfica de los resultados obtenidos por el ACP.

De esta forma, se usaran los siguientes paquetes para la ejecución del código.

#Manejo de datos
library(tidyverse)
library(readr)
library(dplyr)
library(readxl)
#Gráficos
library(ggplot2)
library(plotly)
library(GGally)
#ACP
library(ade4)
library(FactoClass)
library(FactoMineR)
library(factoextra)
#Datos importados
source("DatosSeleccionados.R")

#Ajustes de tema del documento y graficos
library(scales)
library(DT)
library(gt)
library(RColorBrewer)
theme_set(theme_minimal(base_size = 24, base_family = "Atkinson Hyperlegible"))
library(hrbrthemes)

ACP de todas las variables.

Para comenzar, vamos a considerar todas las variables de tipo cuantitativo de nuestra base de datos para el desarrollo del ACP, en caso de que el lector no recuerde cuáles son dichas variables, pueden ser consultadas aquí.

Ahora, como primer paso, observamos las correlaciones que posee nuestro conjunto de datos a través de su matriz de correlaciones.

Matriz de correlación

La matriz de correlaciones nos da indicios de la posible relación entre las variables, las cuales se resumen en las siguientes:

  • Las variables que corresponden a la edad a la cual comenzaron a consumir alguna droga o sustancia (Tabaco, alcohol, marihuana, cocaína,…) se encuentran altamente relacionadas.

  • Las variables de TIEMPO_RECLUIDO y TIEMPO_PROCESO, y NUM_HIJOS y N_PERSONAS_DEPENDIENTES se encuentran relacionadas, esto tiene sentido dentro del contexto lógico de lo que representa cada una de estas variables.

  • Las demás variables son independientes, o muy poco relacionadas, entre ellas.

Así, se puede esperar que el ACP resultantes tenga a las variables correspondientes a las edades como principales representantes de su primer eje.

Ahora, construiremos el ACP utilizando las funciones dudi.pca de ade4 y PCA de FactoMineR . Pese a que ambas funciones dan el mismo resultado, los paquetes asociados a estas funciones nos dan alternativas para graficar los resultados obtenidos.

ACP

res.pca<-FactoMineR:: PCA(DatosCuantitativos, scale.unit = TRUE, ncp = 20, graph = FALSE)
acp <- dudi.pca(DatosCuantitativos, scannf = FALSE, nf = 15) 

# El parámetro nf indica cuantos ejes voy a conservar
valp <- t(inertia(acp)$tot.inertia) # valores propios
kable(valp, digits = 3)
Ax1 Ax2 Ax3 Ax4 Ax5 Ax6 Ax7 Ax8 Ax9 Ax10 Ax11 Ax12 Ax13 Ax14 Ax15 Ax16 Ax17 Ax18 Ax19 Ax20 Ax21 Ax22 Ax23 Ax24
inertia 4.261 1.487 1.328 1.180 1.131 1.027 1.017 1.000 0.986 0.908 0.881 0.851 0.846 0.817 0.765 0.734 0.713 0.665 0.626 0.615 0.590 0.572 0.507 0.494
cum 4.261 5.748 7.076 8.257 9.388 10.414 11.431 12.431 13.417 14.325 15.206 16.057 16.903 17.719 18.484 19.218 19.931 20.596 21.222 21.837 22.427 22.999 23.506 24.000
cum(%) 17.754 23.951 29.485 34.403 39.115 43.394 47.630 51.796 55.902 59.687 63.358 66.902 70.428 73.830 77.016 80.076 83.045 85.816 88.423 90.987 93.445 95.830 97.942 100.000

Como resultado inicial del ACP, se tiene que los 3 primeros ejes capturan un 29.48% de la varianza dada por las variables. Sin embargo, los otros ejes capturan aproximadamente un 5% de varianza, (ver gráfico izquierda); Por lo tanto no es posible resumir de forma drástica la dimensionalidad de la información dada por las variables, lo que puede interpretarse como independencia entre estas.

Esta proposición puede confirmarse a través de los valores propios obtenidos (derecha), donde se obtuvieron 9 valores mayores o iguales a 1, y un total de 14 valores propios cercanos a 1 (mayores a 0.8).

Varianza explicada por los ejes

Valores propios

Contribución de cada variable a los ejes

Para entender que a partir de cuáles variables fueron consideradas en cada uno de los ejes obtenidos, nos es de interés saber cuál es la contribución y la calidad de representación de las variables en cada uno de los ejes. Para esto, utilizaremos el valor \(cos^2(x)\) obtenido para cada eje, esto lo visualizamos por medio de las funciones factoextra::fviz_cos2() y factoextra::fviz_contrib().

Como sabemos, las variables que contribuyen a la construcción de cada uno de los ejes tienden a ser las mismas que poseen una mejor calidad de representación, por lo que, en la siguiente sección analizaremos más en detalle la calidad de representación .

A partir de estos grágicos de contribución, se puede realizar la siguiente interpretación de los 3 primeros ejes.

  1. 1er eje: Este eje representa la edad a la cual la persona comienza a consumir cualquier sustancia psicoactiva fuera del alcohol y el tabaco.
  2. 2do eje: Este eje representa la edad a la cual la persona comienza a consumir alcohol o tabaco.
  3. 3er eje: Este eje representa el tiempo que la persona debe pasar en el centro penitenciario.

Calidad de representación de los ejes.

Ahora, de forma similar, para observar cuán bien representada está cada una de las variables en cada uno de los ejes, utilizaremos el valor \(cos^2(x)\) obtenido para cada uno de estos, esto lo visualizamos por medio de las funciones factoextra::fviz_cos2().

De este eje, se puede observar que las edades en las cuales se realizó el primer consumo de sustancias psicoactivas son las mas representadas. Siendo las edades de consumo de tabaco y el alcohol los menos representados entre este conjunto de variables.

En este eje, podemos observar que las 3 variables mejor representadas son la edad de la persona, y las edades en las cuales se consumió por primera vez alcohol y tabaco, lo que complementa al primer eje respecto al consumo de sustancias psicoactivas.

Este eje se caracteriza por las variables delictivas del tiempo que la persona lleva en el centro penitenciario, cuánto tiempo fue condenado y la cantidad de procesos penales que tiene abierto la persona. Esto tiene sentido, pues en la realidad estas 3 variables se encuentran bastante relacionadas desde su significado.

Este eje depende únicamente de 2 variables, las cuales son la cantidad de hijos y de personas dependientes al individuo; la asociación entre estas 2 variables tiene sentido, pues en la mayoría de casos los hijos menores de edad son personas dependientes y viceversa.

A partir de este eje, las componentes principales tienden a representar principalmente a una sola variable del conjunto de datos, lo que indica la independencia entre las variables.

El eje 7 es el más próximo respecto a las variables de vida intracarcelaria, pues establece una relación entre la cantidad de horas que una persona permanece en su celda y la cantidad de veces que esta persona ha sido sentenciada a un centro penitenciario. Sin embargo, estos resultados no son confiables debido a la baja varianza que posee este eje.

De esto, tenemos que los 3 primeros ejes representan (principalmente) los siguientes conjuntos de variables:

  • 1er eje: Este eje representa la edad a la cual la persona consumió sustancias por primera vez (excepto tabaco y alcohol)

  • 2do eje: El representa principalmente las edades a la cual la persona consumió tabaco y alcohol por primera vez, junto a la edad de la persona.

  • 3er eje: Este eje está más relacionado a características delicitivas, pues la calidad de representación es alta para las variables relacionadas al tiempo que lleva dentro de la carcel, el tiempo que fue condenado y la cantidad de procesos abiertos que posee.

De esta forma, ya podemos realizar una mejor interpretación de los planos factoriales.

Planos factoriales

Ahora que poseemos una mejor interpretación de los ejes obtenidos en el ACP. Proyectamos cada una de las variables en el plano factorial para identificar las posibles relaciones entre ellas.

A partir de aquí, consideraremos únicamente las 3 primeras componentes principales, pues las demás componentes representan máximo 2 variables que, por su contexto, se conoce previamente que están relacionadas; además, estas variables no poseen una alto porcentaje de varianza explicada.

Warning: ggrepel: 1 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Concordando con los resultados anteriores, las variables que tratan sobre la edad de consumo de alguna sustancia psicoactiva se encuentran más alineadas a la primera componente principal. También, la edad de la persona y la edad en la que comenzó a consumir tabaco y alcohol se encuentran más alineadas con la segunda componente.

Las demás variables tienen poca contribución a las componentes y se encuentran próximas al centro de la circuferencia, indicando poca o nula representación de estas con las componentes.

Warning: ggrepel: 12 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

En este caso, las variables relacionadas al tiempo dentro del centro penitenciario y los delitos cometidos se encuentran más alineadas al 3 eje, encuanto a las edades de consumo de sustancias al segundo eje.

Podemos resaltas que hay sustancias que se encuentran poco representadas por el segundo eje. Finalmente, al igual que en el plano factorial anterior, las demás variables son poco representadas por estas dimensiones.

Warning: ggrepel: 9 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Al igual que en los planos vistos anteriormente, las edades de consumo se relacionan con el primer eje y las variables delictivas con el 3 eje. Aquí observamos que varias variables están próximas de formar un ángulo de 90 grados, lo que implica una independencia entre estas.

Proyección de los individuos en los planos factoriales

Ahora observaremos cómo se distribuyen los individuos en el espacio generado por las componentes principales obtenidas. Junto a esto, consideraremos también la contribución de cada individuo para saber qué tanto se encuentra representado en las dimensiones seleccionadas.

Dado que los ejes están normalizados, este gráfico se puede interpretar por cuadrantes.

  • Primer cuadrante El cuadrante superior izquierdo ubica a los individuos que comenzaron a consumir drogas en edades tempranas, pero consumieron tabaco o alcohol en edades tardías (respecto a la media)

  • Segundo cuadrante El cuadrante superior derecho ubica a los individuos que comenzaron a consumir drogas, tabaco y alcohol en edades tardías (respecto a la media de la población encuestada).

  • Tercer cuadrante El cuadrante inferior izquierdo ubica a los individuos que comenzaron a consumir drogas, tabaco y alcohol en edades tempranas (respecto a la media).

  • Cuarto cuadrante El cuadrante inferior derecho ubica a los individuos que comenzaron a consumir alcohol o tabaco en edades tempranas, y drogas a una edad tardía (respecto al promedio del grupo).

Así, vemos que una gran parte de la población se encuentra en el centro o en el primer cuadrante, indicando que una parte considerable de los individuos consumió drogas antes del promedio y alcohol y tabaco después del promedio.

Sin embargo, esto también puede debere a una mala representación de los datos, pues para las personas que nunca han consumido tales sustancias, se les fue asignado un valor de 98/99 en la base de datos lo cual puede estar influenciando en la media de la población, ocasionando estos resultados.

Si bien estas dos dimensiones no son representativas para la gran parte de la población, el eje vertical representa el tiempo que han pasado en el centro penitenciario, y el eje horizontal la edad de consumo de tabaco y alcohol.

Siendo así, la mayoría de la población posee un tiempo dentro del centro penitenciario próximo a la media, a excepción de algunos grupos que están por encima de esta.

Se puede observar que la primera componente principal da una buena representación de un peuqeño grupo de individuos que no han consumnido ningún alucinogeno, pero sí han consumido tabaco y alcohol.

Siendo así, es necesario de más componentes principales para dar una buena representación de la población carcelaria encuestada.

Grupos en las proyecciones

Ahora consideraremos las posibles subpoblaciones dentro del centro penitenciario a partir de las categorías dadas por variables cualitativas, esto con el objetivo de ver si existen variables categóricas que se vean representadas dentro de las 3 primeras componentes principales.

La mayoría de individuos de la población pertenece a la categoría 1 (hombres), pero no hay una división visible entre estas 2 categorías.

En este gráfico no se observa un patrón en la escala de color asignada para la edad, lo que indica que la edad no se ve afectada por las 2 primeras componentes principales.

Al observar la segunda y tercera componente principal, se ve un ligero patrón entre los individuos, donde la edad tiene a aumentar a medida que el eje 2 aumenta. Esto tiene sentido, pues la edad y el consumo de tabaco y alcohol son las que mayor se ven representadas por la segunda componente principal.

Too few points to calculate an ellipse

Esta puede llegar a ser algo redundante, pues las personas de la categoría 2 (nunca ha consumido marihuana) fue asignada a un valor de 98 o 99 en la edad a la cual consumió esta droga. Por lo tanto, es de esperarse que las personas que no hayan consumido se encuentren en el extremo derecho del primer eje, el cual representa la edad a la cual se consumieron dchas sustancias.

Ocurre un caso similar al consumo de marihuana.

Too few points to calculate an ellipse

Too few points to calculate an ellipse

Las categorías son las siguientes:

  • 1 El centro penitenciario le proporciona servicios médicos

-2 El centro penitenciario no le proporciona servicios médicos

-3 No solicitado servicios médicos al centro penitenciario

-8 No sabe

-9. No responde

Siendo así, estas variables no presentan ninguna división dada por las 2 dimensiones y se concentran en el centro del plano, indicando una baja representación de los datos.

De forma análoga a la variable anterior, las componentes principales no muestran una diferencia significativa para esta categoria.

No se ve una diferencia significativa para ningún nivel de estudios.

Si bien no se mostraron todas las variables cualitativas de la base de datos, todas las variables poseen un comportamiento similar a las variables mostradas. Los clusters vistos dentro de la población muestran que las componentes principales resumen primordialmente las relaciones entre el consumo de drogas dentro de la población carcelaria.

Variables cualitativas en los planos factoriales

Ahora realizaremos un análisis similar, considerando el promedio (centro de gravedad) de cada categoría en una variable cualitativa. Para esto, utilizaremos el siguiente plano factorial.

Este es el mismo plano factorial compuesto por los 2 primeros ejes, pero considerado una orientación distinta de estos.

Para el análisis, distinguiremos las variables seleccionadas por la clasificación hecha previamente de variables sociodemográficas, económicas, delictivas y de vida intracarcelaria.

Variables sociodemográficas

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
M 0.81 0.035 0.120 0.037 -0.104 -0.03 0.038 0.021 -0.012 0.007 -0.025 0.010 -0.022 0.012 0.027 0.030 -0.003
F 0.19 0.631 -0.511 -0.157 0.444 0.13 -0.163 -0.090 0.052 -0.031 0.108 -0.042 0.092 -0.053 -0.113 -0.127 0.011

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
M 29.765 15.512 -46.278 -14.34 18.405 10.664 -6.223 3.733 -13.072 5.285 -11.726 6.925 14.775 16.878 -1.512 0.414 0.039 0.312 0.027 0.042 0.013 0.004 0.002 0.018 0.003 0.013 0.004 0.02 0.025 0
F -29.765 -15.512 46.278 14.34 -18.405 -10.664 6.223 -3.733 13.072 -5.285 11.726 -6.925 -14.775 -16.878 1.512 0.414 0.039 0.312 0.027 0.042 0.013 0.004 0.002 0.018 0.003 0.013 0.004 0.02 0.025 0

Interpretación En promedio, las mujeres de los centro penitenciarios comienzan el consumo de sustacias psicoactivas, alcohol y tabaco en edades más tardías que los hombres.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
X00 0.032 2.508 -0.620 -0.089 0.165 0.151 -0.450 -0.028 0.057 0.171 -0.190 0.460 -0.906 -0.130 0.417 -0.065 -0.476
X01 0.002 2.156 -0.536 0.157 0.044 0.178 -0.705 0.164 0.144 0.167 -0.213 0.443 -0.751 -0.105 0.442 -0.066 -0.209
X02 0.214 0.111 -0.170 -0.019 -0.022 0.022 -0.026 0.027 0.027 0.032 -0.085 0.134 -0.077 -0.034 0.099 0.027 -0.084
X03 0.459 0.044 0.163 0.088 -0.033 -0.014 -0.002 -0.027 0.021 -0.005 0.001 0.015 0.060 -0.009 -0.023 0.005 0.040
X04 0.009 0.414 -0.320 -0.419 -0.032 -0.013 0.264 0.094 0.005 -0.049 -0.021 -0.049 0.026 0.035 -0.016 0.005 -0.122
X05 0.001 1.645 -0.337 -0.867 0.423 0.146 0.289 0.114 -0.130 0.008 0.032 -0.205 -0.065 -0.135 0.159 -0.125 -0.029
X06 0.202 0.076 0.130 0.015 0.026 0.005 -0.015 0.014 -0.027 -0.020 0.074 -0.122 0.028 0.044 -0.095 -0.024 0.083
X07 0.014 2.572 -0.280 -0.598 -0.085 -0.235 0.842 0.158 -0.241 -0.176 0.158 -0.526 0.797 0.185 -0.326 0.002 0.219
X08 0.063 0.560 -0.500 -0.338 0.146 -0.016 0.152 0.011 -0.128 -0.056 0.108 -0.282 0.041 0.061 -0.035 -0.017 -0.034
X09 0.004 2.965 -1.230 -0.770 0.234 -0.125 0.636 0.071 -0.208 -0.042 0.142 -0.399 0.238 0.054 0.149 0.007 -0.169
X98 0.000 3.616 0.008 0.546 0.546 0.386 -0.460 0.873 0.499 -0.012 -0.106 0.318 -0.620 -0.512 0.327 -0.147 -0.550
X99 0.000 25.983 1.147 -1.418 2.484 -0.012 0.013 1.993 0.093 -0.090 -0.494 2.352 -1.590 1.265 -0.968 0.196 -0.865

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
00 -13.597 -3.292 6.485 6.313 -19.161 -1.235 2.575 7.742 -8.659 21.839 -43.709 -6.389 20.507 -3.250 -24.633 0.153 0.003 0.011 0.009 0.081 0.000 0.001 0.012 0.014 0.084 0.327 0.007 0.069 0.002 0.090
01 -3.111 1.538 0.452 1.960 -7.937 1.936 1.706 2.004 -2.574 5.562 -9.572 -1.360 5.749 -0.868 -2.867 0.133 0.011 0.001 0.015 0.231 0.012 0.010 0.013 0.021 0.091 0.261 0.005 0.090 0.002 0.020
02 -10.686 -1.971 -2.490 2.564 -3.190 3.395 3.463 4.144 -11.037 18.159 -10.594 -4.739 13.886 3.796 -12.446 0.261 0.003 0.004 0.004 0.006 0.006 0.007 0.009 0.064 0.160 0.053 0.010 0.087 0.006 0.063
03 18.029 16.407 -6.610 -2.918 -0.500 -6.127 4.761 -1.074 0.311 3.553 14.628 -2.129 -5.607 1.352 10.454 0.603 0.174 0.025 0.004 0.000 0.017 0.010 0.001 0.000 0.005 0.082 0.002 0.012 0.001 0.036
04 -3.615 -8.008 -0.647 -0.269 5.788 2.163 0.112 -1.137 -0.497 -1.196 0.646 0.893 -0.397 0.130 -3.247 0.247 0.423 0.002 0.000 0.168 0.021 0.000 0.006 0.001 0.006 0.002 0.003 0.001 0.000 0.036
05 -1.058 -4.609 2.381 0.872 1.763 0.731 -0.838 0.052 0.210 -1.394 -0.451 -0.952 1.118 -0.894 -0.217 0.069 0.457 0.109 0.013 0.051 0.008 0.010 0.000 0.001 0.026 0.003 0.011 0.015 0.009 0.001

Interpretación En promedio, a medida que aumenta el nivel educativo, el consumo de sustancias psicoactivas, tabaco y alcohol comienza de forma más tardía.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
X01 0.110 0.286 0.453 0.204 0.062 0.073 -0.078 -0.018 0.053 -0.021 0.003 0.058 0.046 -0.047 -0.063 0.023 0.036
X02 0.032 0.071 0.156 0.006 -0.020 0.105 0.056 -0.065 0.036 -0.005 -0.057 0.052 -0.017 -0.065 0.019 0.011 -0.042
X03 0.028 2.351 1.460 0.264 0.039 0.152 -0.079 -0.039 0.201 -0.006 0.005 0.137 0.032 0.109 -0.017 -0.046 0.138
X04 0.005 3.870 1.908 -0.074 0.033 0.063 -0.134 0.005 0.082 0.046 -0.012 0.119 -0.053 -0.016 -0.082 -0.015 0.350
X05 0.227 0.117 -0.268 0.002 -0.007 0.015 -0.112 0.029 -0.043 0.024 -0.066 0.070 -0.084 -0.018 0.083 0.009 -0.052
X06 0.013 2.099 1.316 0.433 0.063 0.146 -0.153 0.019 0.213 0.011 0.110 0.099 0.077 0.018 -0.056 0.068 0.197
X07 0.282 0.026 -0.095 0.038 -0.062 -0.027 0.013 0.004 -0.013 0.009 -0.022 -0.003 -0.044 0.015 0.053 0.021 -0.025
X08 0.017 0.473 0.093 -0.277 -0.270 -0.104 0.453 -0.001 -0.026 -0.039 -0.006 0.010 0.210 -0.043 -0.180 0.017 0.079
X09 0.078 0.165 -0.078 0.169 0.189 -0.104 -0.207 -0.023 0.047 0.006 0.079 -0.048 0.020 0.002 -0.049 -0.084 0.016
X10 0.019 0.708 0.347 0.027 0.071 0.413 -0.252 0.017 0.041 -0.026 0.064 -0.095 0.094 -0.018 -0.357 -0.085 0.237
X11 0.001 3.239 1.186 -0.052 0.039 -0.128 0.873 -0.175 0.675 -0.278 -0.431 -0.165 0.310 0.088 0.055 -0.011 0.095
X12 0.008 0.487 -0.493 -0.127 0.120 0.077 -0.118 -0.067 0.026 0.085 -0.034 0.072 -0.261 -0.044 0.155 0.004 -0.208
X13 0.006 1.833 -0.861 -0.710 -0.146 -0.083 0.649 0.209 -0.131 -0.031 0.073 -0.043 0.018 0.039 -0.007 0.044 -0.046
X14 0.006 10.409 3.103 0.103 0.210 0.254 0.052 -0.124 0.409 0.010 0.075 0.299 0.267 0.107 0.148 -0.209 0.012
X15 0.095 0.241 -0.104 -0.258 -0.148 -0.104 0.287 -0.042 -0.022 -0.011 0.055 -0.060 0.144 0.005 -0.116 -0.005 0.063
X98 0.004 1.235 -0.009 -0.250 0.178 -0.488 0.465 0.251 0.465 -0.069 0.277 -0.060 0.319 -0.075 -0.367 -0.149 -0.019
X99 0.002 0.920 -0.135 -0.334 0.297 -0.106 0.568 0.284 0.011 -0.078 0.111 -0.017 0.267 -0.103 -0.290 0.237 -0.022
No.paró.estudios 0.068 0.625 -0.538 -0.360 0.156 -0.020 0.177 0.021 -0.130 -0.055 0.108 -0.283 0.047 0.060 -0.024 -0.015 -0.045

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
01 19.156 14.566 4.730 5.842 -6.409 -1.549 4.627 -1.811 0.243 5.272 4.278 -4.466 -5.938 2.261 3.615 0.719 0.145 0.014 0.019 0.021 0.001 0.010 0.002 0.000 0.012 0.007 0.008 0.014 0.002 0.005
02 3.387 0.219 -0.765 4.321 2.373 -2.871 1.610 -0.233 -2.558 2.466 -0.826 -3.172 0.951 0.552 -2.160 0.341 0.000 0.005 0.154 0.044 0.059 0.018 0.000 0.045 0.039 0.004 0.060 0.005 0.002 0.025
03 29.562 9.037 1.401 5.847 -3.087 -1.591 8.328 -0.251 0.199 6.007 1.432 4.921 -0.761 -2.123 6.608 0.907 0.030 0.001 0.010 0.003 0.001 0.017 0.000 0.000 0.008 0.000 0.005 0.000 0.001 0.008
04 15.612 -1.019 0.487 0.980 -2.129 0.087 1.381 0.785 -0.197 2.117 -0.962 -0.297 -1.497 -0.276 6.754 0.941 0.001 0.000 0.001 0.005 0.000 0.002 0.001 0.000 0.004 0.001 0.000 0.002 0.000 0.032
05 -17.452 0.181 -0.771 1.883 -14.146 3.899 -5.698 3.168 -8.896 9.823 -12.065 -2.573 12.163 1.312 -7.996 0.614 0.000 0.000 0.002 0.107 0.007 0.016 0.005 0.037 0.041 0.061 0.003 0.059 0.001 0.023
06 18.129 10.091 1.557 3.826 -4.102 0.537 6.020 0.319 3.158 2.953 2.326 0.543 -1.730 2.144 6.408 0.825 0.089 0.002 0.010 0.011 0.000 0.022 0.000 0.006 0.005 0.003 0.000 0.001 0.002 0.019

Interpretación

Las categorías de estas variables son las siguientes:

  • 01: Porque no quise/ no me interesa.
  • 02: Porque no se me da/ me resultaba difícil.
  • 03: Prefería hacer otras actividades de ocio [estar con amigos o novio(a), vagar, etc.]
  • 04: Por realizar actividades ilegales
  • 05: No tenía dinero
  • 06: Me suspendieron o expulsaron de la escuela.
  • 07:Tenía que trabajar
  • 08: Porque no tenía papeles/documentos.
  • 09: Porque me casé/me embaracé o embaracé a mi pareja.
  • 10: Porque me detuvieron, caí en la cárcel.
  • 11: Porque salí de la cárcel.
  • 12: Porque tenía que ayudar con las labores del hogar.
  • 13: Por problemas de salud.
  • 14: Porque me drogaba o tomaba.
  • 98: No sabe
  • 99: No responde

El gráfico mostrado muestra que, en promedio, la población carcelaria mexicana comenzó el consumo de sustancias a edades tempranas paró sus estudios debido a problemas en la escuela, falta de interés o problemas delicitivos.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.814 0.293 0.298 0.260 -0.168 -0.057 0.133 0.044 -0.113 -0.011 -0.003 -0.093 -0.101 0.019 0.036 -0.042 -0.101
No 0.185 5.633 -1.308 -1.140 0.737 0.249 -0.584 -0.192 0.496 0.047 0.011 0.406 0.444 -0.085 -0.156 0.182 0.443
No.sabe 0.000 27.300 -1.703 -0.907 2.129 0.807 -0.283 0.753 2.892 -0.188 2.035 0.683 -1.042 -1.043 -1.024 0.985 -0.655
No.responde 0.000 21.671 -1.901 -1.750 2.704 -0.307 1.302 0.504 0.666 -0.203 0.773 1.129 -0.010 -0.082 -1.610 0.628 0.384

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 75.044 110.690 -75.905 -27.126 64.805 22.320 -58.324 -5.503 -1.447 -50.507 -55.841 10.967 20.315 -23.929 -59.899 0.304 0.231 0.097 0.011 0.060 0.006 0.044 0.000 0.000 0.029 0.035 0.001 0.004 0.006 0.035
No -74.956 -110.566 75.638 27.144 -64.953 -22.404 58.192 5.533 1.303 50.383 55.901 -10.928 -20.108 23.833 59.903 0.304 0.231 0.096 0.011 0.061 0.007 0.044 0.000 0.000 0.029 0.035 0.001 0.004 0.006 0.035
No sabe -1.429 -1.289 3.199 1.287 -0.460 1.287 4.968 -0.325 3.551 1.241 -1.922 -1.959 -1.928 1.888 -1.298 0.106 0.030 0.166 0.024 0.003 0.021 0.306 0.001 0.152 0.017 0.040 0.040 0.038 0.036 0.016
No responde -2.913 -4.538 7.422 -0.893 3.873 1.575 2.089 -0.642 2.464 3.747 -0.033 -0.282 -5.536 2.198 1.390 0.167 0.141 0.338 0.004 0.078 0.012 0.020 0.002 0.028 0.059 0.000 0.000 0.120 0.018 0.007

Interpretación Al igual que las agrupaciones anteriores hechas respecto a las variables de consumo de sustancias, esta clasificación puede llegar a ser redundante.

Como información adicional, este gráfico nos dice que, en promedio, las personas que han consumido alcohol tienden a consumir en edades más tempranas otras sustancias a compración de los que no han consumido alcohol, los cuales comienzan a consumir sustancias en edades mucho más tardías.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.468 2.282 1.306 0.421 -0.192 0.045 0.072 -0.041 0.048 -0.005 -0.016 0.111 0.091 -0.087 -0.114 0.089 0.260
No 0.532 1.766 -1.149 -0.370 0.168 -0.040 -0.064 0.035 -0.042 0.004 0.014 -0.098 -0.080 0.076 0.101 -0.079 -0.229
No.sabe 0.000 21.976 -1.358 -0.018 1.885 0.628 -0.195 0.662 2.566 -0.180 1.994 0.292 -1.227 -0.854 -0.866 0.903 -0.892
No.responde 0.000 8.141 -1.303 -1.206 1.707 -0.167 0.742 0.520 -0.098 -0.106 0.003 0.313 0.026 0.218 -0.850 0.336 0.138

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 147.082 80.337 -38.766 9.727 15.709 -9.312 10.982 -1.120 -3.812 27.031 22.435 -21.882 -28.806 22.936 69.182 0.747 0.078 0.016 0.001 0.002 0.001 0.001 0.000 0.000 0.005 0.004 0.003 0.006 0.003 0.030
No -146.990 -80.222 38.557 -9.723 -15.783 9.238 -11.033 1.136 3.763 -27.074 -22.406 21.877 28.932 -23.002 -69.173 0.747 0.078 0.016 0.001 0.002 0.001 0.001 0.000 0.000 0.005 0.004 0.003 0.006 0.004 0.030
No sabe -1.139 -0.025 2.832 1.002 -0.317 1.132 4.408 -0.312 3.479 0.531 -2.263 -1.605 -1.632 1.732 -1.767 0.084 0.000 0.162 0.018 0.002 0.020 0.300 0.001 0.181 0.004 0.068 0.033 0.034 0.037 0.036
No responde -2.363 -3.700 5.542 -0.576 2.612 1.921 -0.365 -0.396 0.010 1.231 0.102 0.886 -3.458 1.391 0.590 0.209 0.179 0.358 0.003 0.068 0.033 0.001 0.001 0.000 0.012 0.000 0.006 0.089 0.014 0.002

Interpretación La información nueva dada por este gráfico es similar al caso del alcohol, las personas del centro penitenciario que consumieron marihuana comenzaron a consumir tabaco y alcohol en edades más tempranas que los que no consumen esta droga.

Variables económicas

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
X1 0.249 0.100 -0.224 -0.083 -0.006 0.112 -0.050 -0.037 -0.037 -0.006 -0.072 0.062 0.036 -0.054 -0.004 -0.016 -0.014
X2 0.241 0.021 -0.073 0.084 -0.031 0.052 -0.046 -0.004 -0.016 0.003 -0.024 0.022 0.015 -0.013 -0.014 0.000 -0.001
X3 0.131 0.017 0.038 0.114 -0.025 0.000 0.021 0.005 -0.007 0.013 0.003 -0.009 0.003 0.025 -0.005 -0.003 0.006
X4 0.088 0.028 0.116 0.050 -0.032 -0.052 0.029 0.027 -0.002 -0.010 0.013 -0.044 -0.004 0.035 0.032 0.017 -0.003
X5 0.075 0.055 0.107 0.051 -0.014 -0.106 0.034 0.046 -0.005 0.008 0.048 -0.079 -0.032 0.066 0.017 0.028 0.024
X6 0.177 0.178 0.277 -0.097 0.000 -0.217 0.071 0.033 0.034 0.008 0.081 -0.056 -0.072 0.044 0.047 0.038 0.017
X7 0.029 0.540 0.095 -0.017 0.450 0.398 -0.033 -0.124 0.162 -0.038 0.127 0.003 0.137 -0.013 -0.186 -0.200 -0.028
X8 0.005 0.455 0.037 -0.332 0.349 -0.141 0.227 0.076 0.197 -0.098 0.132 -0.034 -0.024 -0.129 -0.162 -0.089 -0.071
X9 0.006 1.126 -0.310 -0.540 0.181 -0.042 0.499 0.140 0.504 -0.064 -0.005 0.062 -0.232 -0.232 -0.196 0.052 -0.081

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
-15.462 -9.745 -0.706 14.757 -6.743 -5.231 -5.296 -0.864 -10.314 9.256 5.539 -8.362 -0.579 -2.563 -2.214 0.499 0.069 0.000 0.126 0.025 0.014 0.014 0.000 0.051 0.038 0.013 0.029 0.000 0.003 0.002
-4.926 9.633 -3.737 6.661 -6.082 -0.493 -2.264 0.394 -3.409 3.207 2.209 -1.960 -2.187 0.022 -0.197 0.248 0.332 0.045 0.126 0.101 0.001 0.013 0.000 0.028 0.022 0.010 0.008 0.010 0.000 0.000
1.793 8.973 -2.061 -0.025 1.943 0.514 -0.655 1.228 0.255 -0.883 0.266 2.596 -0.550 -0.314 0.658 0.087 0.761 0.036 0.000 0.027 0.002 0.003 0.010 0.000 0.004 0.000 0.036 0.002 0.001 0.002
4.319 3.147 -2.119 -3.679 2.063 2.076 -0.188 -0.753 1.000 -3.582 -0.336 2.957 2.696 1.463 -0.240 0.474 0.088 0.036 0.095 0.029 0.026 0.000 0.003 0.006 0.070 0.001 0.044 0.037 0.010 0.000
3.667 2.939 -0.839 -6.900 2.239 3.203 -0.368 0.557 3.408 -5.866 -2.373 5.076 1.316 2.155 1.917 0.211 0.047 0.003 0.207 0.021 0.039 0.001 0.001 0.042 0.115 0.018 0.081 0.005 0.014 0.010
15.396 -9.115 -0.022 -22.957 7.675 3.767 3.860 0.926 9.359 -6.801 -8.782 5.423 5.924 4.858 2.256 0.430 0.053 0.000 0.265 0.028 0.006 0.006 0.000 0.037 0.018 0.029 0.011 0.013 0.008 0.002

Interpretación Todas las categorías están concentradas en el centro del plano, lo que indica que todas estas son pocos representadas en el plano factorial.

Analizando el significado de cada variable, esto tiene sentido, pues los ejes representan la edad a la cual la persona comenzó a consumir sustancias psicoactivas (algo que pudo ser hace años), por lo cual es de esperarse que guarde poca relación con el salario que ganó su último mes antes de ser sentenciado.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.901 0.001 -0.026 -0.001 0.000 0.003 -0.001 0.005 -0.007 -0.003 0.003 -0.013 -0.002 0.004 -0.001 0.001 0.000
No 0.097 0.090 0.226 0.006 -0.008 -0.013 0.006 -0.055 0.054 0.032 -0.030 0.114 0.023 -0.039 0.013 -0.005 0.003
No.sabe 0.001 3.158 1.404 -0.008 0.233 0.161 0.312 0.294 0.607 -0.056 0.382 0.090 -0.338 -0.132 -0.152 -0.149 -0.100
No.responde 0.000 12.039 -0.334 0.288 1.369 -2.871 -0.332 0.525 0.111 0.149 -0.038 0.529 0.016 0.226 -0.833 -0.015 -0.184

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si -9.346 -0.449 -0.062 1.833 -0.547 3.955 -4.845 -2.588 2.174 -9.972 -1.683 3.472 -0.701 0.590 -0.156 0.582 0.000 0.000 0.006 0.001 0.025 0.037 0.010 0.007 0.141 0.004 0.016 0.001 0.000 0.000
No 8.928 0.371 -0.534 -0.991 0.433 -4.399 4.359 2.594 -2.477 9.756 1.972 -3.471 1.168 -0.458 0.324 0.569 0.000 0.001 0.002 0.000 0.033 0.032 0.011 0.010 0.145 0.006 0.017 0.002 0.000 0.000
No sabe 5.183 -0.053 1.541 1.129 2.239 2.214 4.590 -0.427 2.930 0.719 -2.746 -1.091 -1.258 -1.254 -0.868 0.624 0.000 0.017 0.008 0.031 0.027 0.117 0.001 0.046 0.003 0.036 0.006 0.007 0.007 0.003
No responde -0.840 1.226 6.174 -13.733 -1.622 2.695 0.572 0.774 -0.198 2.884 0.090 1.271 -4.706 -0.089 -1.092 0.009 0.007 0.156 0.684 0.009 0.023 0.001 0.002 0.000 0.023 0.000 0.004 0.058 0.000 0.003

Interpretación Dado que las categorias se ubican en el centro del plano, esto da a entender que no poseer deudas o no, no se encuentra representado por la edad de inicio de consumo de sustancias.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.262 0.034 0.064 0.064 0.002 -0.114 0.042 -0.043 -0.026 0.011 0.035 -0.035 0.011 0.030 0.046 0.039 -0.013
No 0.736 0.004 -0.023 -0.024 -0.002 0.042 -0.016 0.015 0.008 -0.004 -0.013 0.011 -0.004 -0.011 -0.015 -0.014 0.005
No.sabe 0.001 0.875 0.322 0.322 0.281 0.224 0.336 0.098 0.408 -0.039 0.228 0.265 -0.143 -0.121 -0.178 -0.157 0.041
No.responde 0.000 14.538 -0.450 0.284 1.499 -3.144 -0.371 0.562 0.145 0.160 -0.038 0.554 0.037 0.285 -0.917 -0.044 -0.117

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 4.581 7.782 0.205 -15.461 5.901 -6.286 -3.776 1.580 5.235 -5.358 1.718 4.831 7.340 6.354 -2.204 0.119 0.120 0.000 0.374 0.052 0.054 0.019 0.003 0.036 0.035 0.003 0.026 0.060 0.044 0.005
No -4.648 -8.033 -0.701 15.920 -6.064 6.066 3.405 -1.581 -5.401 4.987 -1.599 -4.784 -6.937 -6.187 2.191 0.120 0.125 0.001 0.390 0.054 0.049 0.015 0.003 0.038 0.029 0.003 0.025 0.053 0.041 0.005
No sabe 1.474 2.495 2.302 1.947 2.980 0.917 3.823 -0.369 2.168 2.629 -1.434 -1.237 -1.831 -1.637 0.443 0.119 0.119 0.090 0.057 0.129 0.011 0.191 0.002 0.059 0.080 0.023 0.017 0.036 0.028 0.002
No responde -1.089 1.166 6.504 -14.473 -1.744 2.774 0.721 0.800 -0.193 2.907 0.197 1.547 -4.984 -0.246 -0.670 0.014 0.006 0.155 0.680 0.009 0.022 0.001 0.002 0.000 0.021 0.000 0.006 0.058 0.000 0.001

Interpretación Dado que las categorias se ubican en el centro del plano, esto da a entender que no poseer deudas o no, no se encuentra representado por la edad de inicio de consumo de sustancias.

Variables delictivas

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.174 1.529 1.073 0.009 -0.088 -0.111 0.264 -0.165 0.334 0.063 -0.335 0.011 0.020 0.005 0.037 0.062 -0.002
No 0.823 0.068 -0.227 -0.001 0.018 0.024 -0.057 0.034 -0.071 -0.013 0.070 -0.003 -0.004 -0.001 -0.007 -0.013 0.001
No.sabe 0.003 0.358 -0.197 -0.126 0.255 -0.123 0.265 0.174 -0.069 -0.024 0.111 0.209 0.002 -0.044 -0.178 0.030 -0.027
No.responde 0.000 7.859 0.807 -0.371 0.203 -1.472 -0.265 1.292 1.126 -0.078 0.915 0.293 -0.435 -0.194 -0.511 -0.123 -0.196

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 59.169 0.859 -8.669 -11.581 28.282 -18.595 37.761 7.132 -38.449 1.299 2.436 0.607 4.521 7.811 -0.214 0.753 0.000 0.005 0.008 0.046 0.018 0.073 0.003 0.074 0.000 0.000 0.000 0.001 0.003 0.000
No -58.729 -0.604 8.203 12.048 -28.440 17.855 -37.697 -7.026 37.771 -1.732 -2.302 -0.470 -4.027 -7.778 0.324 0.753 0.000 0.005 0.009 0.047 0.017 0.074 0.003 0.072 0.000 0.000 0.000 0.001 0.003 0.000
No sabe -1.193 -1.287 2.760 -1.407 3.109 2.140 -0.853 -0.294 1.393 2.738 0.030 -0.592 -2.417 0.411 -0.391 0.109 0.044 0.182 0.042 0.196 0.084 0.013 0.002 0.034 0.122 0.000 0.005 0.089 0.002 0.002
No responde 1.956 -1.521 0.882 -6.777 -1.244 6.378 5.582 -0.389 4.610 1.539 -2.315 -1.050 -2.779 -0.679 -1.123 0.083 0.018 0.005 0.276 0.009 0.212 0.161 0.001 0.107 0.011 0.024 0.005 0.033 0.002 0.005

Interpretación La segunda componente principal parece no tener relación con la variable. La primera componente principal. Es decir, en promedio, las personas que ya habían sido sentenciadas por algun crimen antes, comenzaron a consumir sustancias psicoactivas en edades más tempranas que las personas que no habían sentenciadas.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
X1 0.383 0.309 0.524 0.081 -0.085 0.027 0.033 -0.058 0.067 0.006 -0.003 0.031 0.050 0.036 0.011 0.039 0.033
X2 0.044 0.095 0.134 0.077 -0.107 0.094 -0.090 -0.046 0.023 0.026 0.045 0.011 0.012 -0.011 -0.125 -0.030 0.098
X3 0.112 0.078 -0.215 -0.009 0.090 -0.024 -0.017 0.009 -0.036 -0.026 0.049 -0.034 -0.039 -0.046 -0.068 -0.035 0.019
X4 0.454 0.179 -0.399 -0.072 0.052 -0.025 -0.021 0.050 -0.052 0.001 -0.013 -0.018 -0.033 -0.018 0.022 -0.023 -0.041
X5 0.003 0.470 0.098 -0.087 0.381 -0.066 0.420 -0.085 -0.052 0.046 -0.213 -0.041 0.018 0.135 0.034 -0.059 -0.042
X8 0.001 1.751 -0.318 -0.045 0.940 0.006 0.501 0.335 0.012 -0.423 0.102 0.025 -0.246 -0.031 -0.193 0.168 -0.171
X9 0.002 1.327 -0.549 -0.209 0.449 -0.253 0.462 0.163 0.413 -0.194 -0.059 0.018 -0.053 -0.005 -0.327 0.287 0.087

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
1 49.637 12.976 -14.359 4.940 6.057 -11.226 12.952 1.240 -0.643 6.304 10.352 7.538 2.340 8.350 7.286 0.890 0.021 0.023 0.002 0.004 0.011 0.014 0.000 0.000 0.003 0.008 0.004 0.000 0.005 0.003
2 3.475 3.376 -4.941 4.607 -4.538 -2.432 1.198 1.398 2.440 0.602 0.691 -0.638 -7.272 -1.744 6.005 0.190 0.063 0.120 0.092 0.086 0.022 0.005 0.007 0.022 0.001 0.002 0.001 0.165 0.009 0.102
3 -9.207 -0.621 6.879 -1.964 -1.387 0.790 -3.130 -2.305 4.333 -3.167 -3.662 -4.392 -6.508 -3.402 1.888 0.594 0.001 0.103 0.007 0.004 0.001 0.016 0.009 0.030 0.015 0.019 0.027 0.059 0.016 0.004
4 -43.699 -13.346 10.223 -5.124 -4.534 11.152 -11.591 0.142 -2.849 -4.379 -7.844 -4.473 5.378 -5.700 -10.715 0.892 0.029 0.015 0.003 0.003 0.014 0.015 0.000 0.001 0.002 0.006 0.002 0.003 0.003 0.010
5 0.607 -0.913 4.222 -0.774 5.047 -1.069 -0.653 0.583 -2.739 -0.556 0.248 1.872 0.466 -0.841 -0.612 0.020 0.016 0.308 0.009 0.375 0.015 0.006 0.004 0.096 0.004 0.001 0.039 0.002 0.008 0.004
8 -1.432 -0.343 7.570 0.048 4.371 3.072 0.106 -3.922 0.958 0.244 -2.434 -0.308 -1.950 1.725 -1.815 0.058 0.001 0.505 0.000 0.143 0.064 0.000 0.102 0.006 0.000 0.035 0.001 0.021 0.016 0.017

Interpretación Las categorias parecen tener poca influencia por la edad de inicio de consumo de sustancias, tabaco y alcohol.

Las categorias de esta variable son:

  • 01: Porque cometió un delito
  • 02: Porque ayudó en la realización de un delito
  • 03: Porque no han podido comprobar su inocencia
  • 04: Porque lo acusaron falsamente, inculparon, confundieron o dicen que cometió un delito
  • 05: Otro
  • 08: No sabe
  • 09: No responde

Si bien la varianza explicada de los ejes no es la suficiente para interpretar como una relación significativa, se tiene que las personas que reconocieron los hechos de forma voluntaria comenzaron a consumir sustancias psicoactivas a edades más tempranas.

Variables de la vida intracarcelaria

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.734 0.004 -0.008 0.004 -0.005 0.011 0.015 -0.049 0.001 0.012 0.011 -0.011 0.007 0.018 0.008 0.001 0.001
No 0.261 0.030 0.022 -0.011 0.004 -0.027 -0.050 0.131 -0.009 -0.032 -0.037 0.031 -0.016 -0.043 -0.019 -0.003 -0.003
No.sabe 0.003 1.222 0.101 0.065 0.591 -0.194 0.443 0.278 0.164 -0.047 0.354 0.027 -0.325 -0.448 -0.182 -0.151 0.102
No.responde 0.001 2.775 -0.201 0.000 0.745 -0.088 0.374 0.996 0.672 -0.169 0.458 0.216 -0.114 -0.340 -0.297 0.065 -0.147

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si -1.604 1.192 -1.864 4.069 5.967 -20.108 0.588 4.854 4.563 -4.895 3.211 7.890 3.551 0.663 0.479 0.016 0.003 0.007 0.028 0.058 0.601 0.001 0.034 0.030 0.032 0.013 0.077 0.015 0.001 0.000
No 1.591 -1.291 0.563 -3.727 -6.951 19.095 -1.308 -4.687 -5.507 4.723 -2.547 -6.847 -3.016 -0.423 -0.575 0.017 0.004 0.001 0.026 0.085 0.583 0.003 0.034 0.047 0.032 0.009 0.062 0.012 0.000 0.000
No sabe 0.672 0.738 7.059 -2.459 5.737 3.778 2.243 -0.649 4.915 0.395 -4.770 -6.686 -2.720 -2.308 1.605 0.008 0.003 0.286 0.031 0.161 0.063 0.022 0.002 0.103 0.001 0.087 0.164 0.027 0.019 0.009
No responde -0.821 0.000 5.449 -0.682 2.966 8.286 5.622 -1.425 3.890 1.908 -1.025 -3.110 -2.722 0.606 -1.417 0.015 0.000 0.200 0.003 0.050 0.357 0.163 0.010 0.076 0.017 0.005 0.042 0.032 0.002 0.008

Interpretación Dadas las distancias de cada categoría al centro y entre ellas, se tiene que la sensación de seguridad en el centro penitenciario no se ve influenciada por la edad a la que comenzó a consumir sustancias.

Esto es de esperarse, pues la sensación de seguridad depende de factores relacionados al cuidado y condiciones de vida actuales dentro de la prisión.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si 0.223 0.067 -0.116 -0.117 -0.145 -0.013 -0.050 -0.008 -0.041 -0.011 -0.014 0.014 0.035 -0.009 -0.082 -0.017 0.058
No 0.775 0.005 0.033 0.034 0.041 0.004 0.014 0.001 0.010 0.003 0.003 -0.004 -0.009 0.003 0.024 0.005 -0.016
No.sabe 0.002 0.650 0.062 -0.351 0.226 0.087 0.166 0.029 0.492 0.038 0.006 0.016 -0.157 -0.169 -0.076 0.111 -0.178
No.responde 0.000 32.329 0.026 -0.054 1.821 -0.018 1.137 3.044 3.139 -0.565 2.072 0.581 -1.029 -1.074 -0.689 0.304 -0.599

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
Si -7.476 -12.713 -16.664 -1.584 -6.186 -1.028 -5.400 -1.491 -1.808 2.013 4.927 -1.316 -11.779 -2.548 8.844 0.200 0.202 0.310 0.002 0.036 0.001 0.025 0.002 0.003 0.003 0.018 0.001 0.099 0.004 0.050
No 7.425 12.950 16.190 1.508 5.859 0.534 4.450 1.538 1.475 -2.117 -4.588 1.662 11.937 2.375 -8.524 0.203 0.216 0.301 0.002 0.034 0.000 0.017 0.002 0.002 0.004 0.016 0.002 0.104 0.004 0.048
No sabe 0.295 -2.823 1.919 0.781 1.526 0.285 4.788 0.377 0.055 0.163 -1.641 -1.793 -0.810 1.204 -1.992 0.006 0.190 0.078 0.012 0.042 0.001 0.373 0.002 0.000 0.000 0.038 0.044 0.009 0.019 0.049
No responde 0.051 -0.177 6.321 -0.066 4.276 12.018 12.452 -2.259 8.349 2.440 -4.384 -4.657 -2.997 1.348 -2.739 0.000 0.000 0.103 0.000 0.040 0.287 0.305 0.010 0.133 0.010 0.033 0.036 0.015 0.003 0.011

Interpretación Dadas las distancias entre cada categoría al centro y entre ellas, podemos decir que esta variable categórica no guarda relación con la edad de inicio de consumo de sustancias.

Los pesos, distancias al cuadrado y las nuevas coordenadas son:

wcat d2 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
No.responde 0.001 14.197 -0.081 -0.225 0.904 -0.872 0.479 1.853 2.029 -0.322 1.528 0.440 -0.294 -0.787 -0.938 0.385 -0.366
No.sabe 0.006 0.426 -0.183 -0.073 0.181 0.041 0.415 0.100 0.017 -0.004 0.047 0.088 -0.257 -0.128 -0.133 -0.085 -0.095
Si 0.273 0.030 0.101 -0.060 -0.056 0.009 -0.042 0.041 -0.027 -0.002 -0.062 0.037 -0.004 -0.033 -0.012 -0.018 0.010
Si 0.645 0.017 -0.069 -0.003 -0.055 0.015 -0.019 -0.058 -0.036 0.011 -0.035 0.004 0.035 0.021 0.018 0.008 0.004

Los valores test y los cosenos cuadrados son:

Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15 Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 Axis7 Axis8 Axis9 Axis10 Axis11 Axis12 Axis13 Axis14 Axis15
No responde -0.264 -1.241 5.265 -5.388 3.021 12.274 13.503 -2.163 10.330 3.100 -2.098 -5.725 -6.840 2.857 -2.808 0.000 0.004 0.058 0.054 0.016 0.242 0.290 0.007 0.165 0.014 0.006 0.044 0.062 0.010 0.009
No sabe -1.721 -1.163 3.063 0.732 7.595 1.924 0.327 -0.075 0.921 1.802 -5.331 -2.703 -2.812 -1.833 -2.106 0.078 0.012 0.077 0.004 0.405 0.024 0.001 0.000 0.005 0.018 0.155 0.039 0.042 0.017 0.021
Si 7.432 -7.427 -7.351 1.311 -5.993 6.126 -4.011 -0.333 -9.481 5.961 -0.712 -5.383 -1.997 -2.969 1.798 0.336 0.117 0.103 0.003 0.058 0.055 0.023 0.000 0.127 0.046 0.001 0.035 0.005 0.010 0.004
Si -11.224 -0.819 -15.905 4.648 -5.841 -19.201 -11.973 3.806 -11.628 1.503 12.361 7.643 6.413 2.832 1.679 0.285 0.001 0.179 0.014 0.021 0.201 0.077 0.008 0.071 0.001 0.072 0.026 0.019 0.003 0.001

Interpretación Dadas las distancias entre cada categoría al centro y entre ellas, podemos decir que esta variable categórica no guarda relación con la edad de inicio de consumo de sustancias.

En resumen, algunas de las variables socioeconómicas poseen relaciones con las 2 primeras componentes principales,las cuales están asociadas a las edades en las cuales la persona consumió por primera vez alcohol, tabaco o sustancias psicoactivas, lo que concuerda con la literatura y otros estudios similares.

Por otro lado,las variables económicas, delictivas y de vida intracarcelaria no mostraron alguna relación entre sus categorías y dichas componentes. Esto es de esperarse en la mayoría de variables, pues desde un razonamiento contextual, es poco probable que la edad de inicio de consumo de sustancias dé información actual sobre las condiciones de vida de la persona; si bien el consumo de sustancias puede tener relación con estas variables, existen características sobre el consumo de sustancias que son más representativas del estilo de vida de la persona. Por ejemplo, la frecuencia de consumo.

Aún así, es posible que estas variables guarden relación con la tercera componente principal, la cual trata sobre el tiempo que la persona lleva dentro del centro penitenciario.

ACP sin considerar el consumo de sustancias psicoactivas

Dado que de las 24 variables seleccionadas para el ACP, 13 de ellas se refieren a la edad de consumo de algún psicoactivo, y las demás variables son muy diversas en torno a la vida de la población privada de la libertad, se planteó la idea de separar estas variables en dos grupos para la construcción de dos ACP.

En este enfoque, las variables que no se analizarían directamente se evaluarían como variables ilustrativas. Esto facilita la lectura del ACP, ya que separa las variables relacionadas a la edad del consumo de sustancias y evita que distorsionen la interpretación de los demás ejes y sus relaciones. Además, dado que de los análisis bivariados previos mostraron que la variable EDAD tiene una alta correlación con la mayoría de las otras variables, se decidió mantener esta variable como la única común en ambos ACPs. Finalmente, al comparar los resultados de ambos ACPs con los del ACP que incluye todas las variables, se observó que los resultados eran prácticamente los mismos. Por lo tanto, se optó por presentar los dos ACPs separados, ya que permiten interpretar la información de forma clara y comprensible.

En principio, dentro de la base de datos existen varios datos atípicos que representan no sabe/ no responde por parte de los individuos, esto se puede corroborar con lo publicado en el informe operativo por parte del INEGI. Dado que no es factible identificar y establecer como ilustrativas este tipo de individuos, se analiza el ACP con estos sabiendo que muy seguramente los individuos más atípicos sean aquellos que no dieron una respuesta clara (puesto que son uno de los valores 98 o 99).

Los resultados iniciales del ACP al excluir las variables de consumo de sustancias son los siguientes.

Ax1 Ax2 Ax3 Ax4 Ax5 Ax6 Ax7 Ax8 Ax9 Ax10
inertia 1.345 1.172 1.089 1.020 1.003 0.997 0.953 0.853 0.823 0.745
cum 1.345 2.517 3.606 4.626 5.629 6.626 7.579 8.432 9.255 10.000
cum(%) 13.450 25.171 36.060 46.264 56.290 66.259 75.789 84.319 92.554 100.000

Como primera diferencia, obtenemos uniformidad en la varianza explicada por cada eje, donde cada eje explica un 10%, lo que indica la poca relación que poseen estas variables.

Dados estos valores, es casi un hecho la independencia entre las variables. Los primeros ejes factoriales resumen la posible correlación que estas variables puedan obtener.

Ahora veremos cómo están compuestos estos ejes.

El primer eje, al igual que el tercer eje de nuestro primer ACP, contiene información del tiempo de condena de la persona, en cuanto al segundo y tercer eje, estos consisten en la cantidad de personas dependientes al individuo y, finalmente, el cuarto eje obtiene la relación entre la cantidad de personas y el tiempo que la persona pasa en su celda. Los demás ejes consisten en una sola variable, por lo cual no se contemplan en este análisis.

Para fines prácticos, nos centraremos de nuevo en los 3 primeros componentes principales.

Planos factoriales

El primer eje puede utilizarse como indicador para evaluar el estado del individuo, ya que del análisis bivariado se evidencia que son estados excluyentes, luego tiene sentido que los individuos más a la derecha están en proceso de ingreso dado que se le evalúan sus delitos abiertos. Diferente a los de la izquierda que ya pasaron el tiempo de proceso de ingreso y están cumpliendo tiempo en reclusión.

A su vez se encuentra una relación entre la edad y el tiempo recluido, esto da indicios de que los reclusos con mayor tiempo de condena tienden a ser también de mayor edad.

Por otro lado el segundo eje se encuentra en gran relación entre las personas con hijos y aquellas con personas dependientes, ambas variables con alta contribución para este factor, luego es un gran indicador para identificar a personas privadas de la libertad responsables de individuos más vulnerables.

El tercer eje no otorga mucha información, pues representa mayoritariamente la edad del individuo.

Estas observaciones pueden confirmarse al observar la distribución de los individuos en los planos factoriales.

Proyección de los individuos

Las edades aumentan hacia la izquierda. Lo que indica la relación entre la edad y el tiempo de reclusión.

La población con hijos se encuentra aislada de los demás.

Se obtiene un crecimiento diagonal en los ejes, lo que indica que los dos ejes representan a la edad.

ACP considerarando únicamente las edad y el consumo de sustancias psicoactivas

Ahora consideraremos únicamente lsa variables relacionadas al consumo de sustancias psicoactivas. Dado que estas variables fueron las más representadas en el primer ACP (donde consideramos todas las variables), es de esperarse que se obtengan los mismos resultados.

En ese caso, la interpretación hecha en un inicio estaría acertada, pues no estaría siendo afectada por otras variables cuantitativas.

El porcentaje de varianza explicada es mayor al obtenido inicialmente, sin embargo, se mantienen valores próximos, lo que da indicios de que las relaciones obtenidas en el primer ACP fueron acertadas.

Ax1 Ax2 Ax3 Ax4 Ax5 Ax6 Ax7 Ax8 Ax9 Ax10 Ax11 Ax12 Ax13 Ax14
inertia 4.234 1.427 0.967 0.924 0.863 0.752 0.720 0.682 0.641 0.617 0.595 0.575 0.508 0.495
cum 4.234 5.661 6.628 7.552 8.415 9.167 9.887 10.569 11.210 11.827 12.422 12.997 13.505 14.000
cum(%) 30.242 40.433 47.339 53.942 60.106 65.477 70.622 75.493 80.074 84.480 88.727 92.835 96.462 100.000

Se obtuvo una reducción en los valores propios mayores o iguales a 1, además de un aumento de 7% en la varianza explicada por las primeras 3 componentes.

Planos factoriales

Al igual que en el primer ACP:

  • La primera componente sugiere ser un indicador de a qué edad se consumió por primera vez algún alucinógeno, por parte de las personas privadas de la libertad.

  • La segunda componente aún representa al tabaco y alcohol, mas parece dar una organización de los alucinógenos de “mayor facilidad de adquisición” a los menos comunes o más raros.

  • Debido a que no están las variables delictivas, la 3 componente principal es un indicador de edad de la población privada de la libertad

Al observar las proyecciones de los individuos en el plano, podemos identificar los mismos patrones y establecer que obtendremos resultados similares a los obtenidos al considerar todas las variables.

Proyección de los individuos

Volviendo a nuestro objetivo del proyecto.

Nuestro objetivo inicial de este proyecto consiste en explorar la existencia de relaciones entre las variables de intracarcelaria, principalmente aquellas relacionadas con el hacinamiento, y las demás variables. Con el fin de ver si existen características que favorezcan o perjudiquen el estilo de vida dentro del centro penitenciario a las personas privadas de la libertad.

Como vimos anteriormente, los ACP realizados no establecen una relación directa entre las variables de vida intracarcelaria dentro de las componentes principales. Así, realizaremos un análisis similar al mostrado anteriormente, centrándonos en el eje 6 (el cual representa la cantidad de personas en la celda).

Warning: ggrepel: 14 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Warning: ggrepel: 1 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Warning: ggrepel: 12 unlabeled data points (too many overlaps). Consider
increasing max.overlaps

Como es de esperarse por la poca varianza explicada por el eje 6, las demás variables no se encuentran bien representada por este eje, así, puede decirse que la cantidad de personas en la celda es independiente de las demás variables cuantitativas consideradas.

Ahora, analizemos cómo esta variable ayuda a describir a nuestra población, para esto, observemos como se distribuyen los individuos sobre este eje.

La mayoría de mujeres se encuentran cerca alcentro del plano, lo que indica poca o nula representación, sin embargo, este grupo se encuentra más concentrado que los hombres.

Si bien no se puede dar una aseveración dada la poca varianza capturada, da ideas de qué el hacinamiento se concentra principalmente en los hombres.

La población con hijos se encuentra aislada de los demás.

Este tipo de gráficos y análisis fueron realizados para cada una de las variables cualitativas. Indicando poca o nula relación entre las categorías de las variables y la cantidad de personas que comparten celda.

Esto nos da indicios de que, según el conjunto de datos utilizado, no existe relación entre el hacinamiento y otras variables sociodemográficas, económicas o delictivas consideradas en la encuesta. Sin mebargo, el conjunto de datos ha ofrecido información valiosa sobre el consumo de drogas dentro de la población estudiada, por lo que, se fuese el caso, el proyecto podría continuar explorando este conjunto de datos a partir de estas variables.