Modelo de minería de datos en la empresa INTEGRA S.A., operador de transporte masivo del Área Metropolitana Centro Occidente para definir patrones de conducción de los operadores de los buses articulados y alimentadores
Trabajo de grado - Maestría
2023-03-21
spa:La presente investigación implementa un modelo aplicable a la base de datos InnoBUS Masivo propeidad de la operadora de Transporte Masivo INTEGRA S.A. en el Área Metropolitana Centro Occidente que permite encontrar patrones de comportamiento de conducción en los operadores en los vehículos articulados y alimentadores. Para el presente estudio se tuvierón en cuenta algunas variables que afectan los comportamientos de conducción normal de los operadores de los vehículos articulados y alimentadores a través del entendimiento de las necesidades de la empresa tales como lo son la velocidad, la aceleración, la desaceleración, la orientación, la ruta entre otras, para esto se usa el método CRISP-DM, El modelo construído usa técnicas de clustering que permite la obtención de los comportamientos de conducción de los operadores con las variables previamente definidas, por último y en conjunto con el equipo de expertos de INTEGRA S.A. se analizan los resultados del estudio para definir las caracterísitcas de la población. El proceso ETL (Extraction, Transform y Load) permite primero realizar la recolección de la data necesaria analizando más de 16 millones de datos y unificando la informacion por medio de una rutina construída en Python. Posterior a esto se hace la transformación de la data dónde se realiza la limpieza y transformación de esta elimianndo extremos o datos atípicos y por último se hace la carga de los datos en el módelo donde se realiza todo el análisis. Como conclusión del trabajo se identifcan 4 perfiles de conducción y se demuestra el éxito del modelo creado. eng:This research implements a model applicable to the InnoBUS Massive database owned by the Massive Transport operator INTEGRA S.A. in the Central Western Metropolitan Area that allows us to find patterns of driving behavior in operators in articulated and feeder vehicles. For the present study, some variables that evolve the normal driving behaviors of the operators of articulated and powered vehicles were taken into account through the understanding of the company's needs, such as speed, acceleration, deceleration, orientation, the route among others, for this the CRISP-DM method is used, the built model uses clustering techniques that allow obtaining the driving behaviors of the operators with the previously defined variables, finally and in conjunction with the team of experts from INTEGRA S.A. the results of the study are analyzed to define the characteristics of the population. The ETL process (Extraction, Transform and Load) allows first to collect the necessary data by analyzing more than 16 million data and unifying the information through a routine built in Python. After this, the transformation of the data is done where the cleaning and transformation of this is done, eliminating extremes or atypical data and finally the data is loaded in the model where all the analysis is carried out. As a conclusion of the work, 4 driving profiles are identified and the success of the created model is demonstrated.
Descripción:
JorgeAugusto_SanchezJacome_2023
Tamaño: 9.094Mb
PDFLEER EN FLIP
Descripción: Acta de sustentación
Tamaño: 768.7Kb
PDF
Descripción: Carta de autorización
Tamaño: 48.38Kb
PDF
Tamaño: 9.094Mb
PDFLEER EN FLIP
Descripción: Acta de sustentación
Tamaño: 768.7Kb
Descripción: Carta de autorización
Tamaño: 48.38Kb