NestedLogit.preprocess_model_data#

NestedLogit.preprocess_model_data(choice_df, utility_equations)[fuente]#

Preprocesar las entradas de iniciación del modelo en un formato que pueda ser utilizado por el modelo PyMC.

Este método prepara la matriz de diseño 3D X, la matriz de covariables fijas F (si es aplicable) y el vector de respuesta codificado y, mientras extrae y almacena metadatos relevantes como alternativas, nombres de covariables fijas, asignaciones de índices de productos y estructuras de anidamiento.

Parámetros:
choice_dfpd.DataFrame

Un DataFrame de pandas que contiene las elecciones observadas y las covariables para cada alternativa. Cada fila representa una observación de elección individual.

utility_equationslist[str]

Una lista de fórmulas de modelo, una por alternativa. Cada fórmula debe tener la forma: "alt_name ~ alt_covariates | fixed_covariates". El lado izquierdo identifica el nombre de la alternativa; el lado derecho especifica las covariables utilizadas para explicar la utilidad de esa alternativa.

Devoluciones:
Xnp.ndarray

Un array numpy 3D de forma (n_observations, n_alternatives, n_covariates), que representa el tensor de covariables para atributos específicos de alternativas.

Fnp.ndarray | None

Un array numpy 2D (n_observaciones, n_covariables_fijas) para covariables compartidas entre alternativas, o None si no se utilizan tales covariables.

ynp.ndarray

Un array numpy unidimensional de etiquetas de destino codificadas (enteros), donde cada entrada representa la alternativa elegida para una observación.

Notas

  • Actualiza el estado interno: asigna X_data, F, alternatives, fixed_covar, y,

prod_indices, nest_indices, all_nests, lambda_lkup, and coords. - Handles single-layer nesting structures only. - Assumes the existence of instance attributes depvar, covariates, and nesting_structure.