Mostrar el registro sencillo del ítem

dc.contributor.advisorJaramillo-Garzón, Jorge Alberto
dc.contributor.authorNarváez Prado, Carlos Wilfredo
dc.date.accessioned2021-08-31T13:48:49Z
dc.date.available2021-12-21
dc.date.available2021-08-31T13:48:49Z
dc.date.issued2021-08-26
dc.identifier.urihttps://repositorio.ucaldas.edu.co/handle/ucaldas/17092
dc.descriptionIlustraciones, gráficasspa
dc.description.abstractspa:El análisis de los datos genómicos por procedimientos experimentales de laboratorio se ha caracterizado por ser muy demorado y costoso, generando una brecha bastante grande entre datos de origen biológico analizados y datos sin ningún tipo de tratamiento, este problema ha sido resuelto en los últimos años con la bioinformática; el avance en la ciencia ha permitido incrementar considerablemente la información genética de la mayoría de organismos biológicos. La bioinformática se ha consolidado como una herramienta moderna, la cual, con base en métodos computacionales y grandes bases de datos, permite realizar análisis genómicos, transcriptónicos y proteómicos; su importancia radica en que ahora es posible intervenir de manera económica y rápida en el análisis de datos biológicos, lo cual, sin duda alguna, redunda en grandes avances en la investigación de la genómica funcional y estructural. De igual forma, la bioinformática permite proporcionar inferencias valiosas desde el punto de vista evolutivo, especialmente con los hongos, los cuales tan solo tienen cinco grupos evolutivos estables, de acuerdo a la clasificación de sus órganos reproductores. EL presente proyecto propone una metodología para la clasificación de proteínas a partir de estrategias basadas en el aprendizaje de máquina semi-supervisado, el cual es probado sobre bases de datos UniProtKB/Swiss-Prot, las cuales se encuentran solo parcialmente analizadas, es decir, contienen datos etiquetados (analizados) y una gran mayoría de datos no etiquetados (sin ningún tipo de análisis de las secuencias proteicas). En el documento se aborda el estado actual del tema de investigación, se explica conceptos básicos de biología molecular y bioinformática, tales como: aminoácidos, proteínas, funciones moleculares, ontología genética, análisis de proteínas, aprendizaje de máquina semi-supervisada, máquinas de vectores de soporte, entrenamiento y clasificación de secuencias proteicas, etc., también se hace una descripción detallada paso a paso del proceso realizado: estructuración de las bases de datos, implementación, validación y análisis de resultados de los dos modelos de clasificación escogidos: máquinas de vectores de soporte transductivas (TSVM) y máquinas de vectores de soporte clásicas (KSVM). La ejecución de este proyecto facilita la comprensión de los organismos fúngicos y por su puesto el entendimiento del comportamiento del hongo “Hemileia vastatrix” también llamado “roya del café”, este organismo es de especial interés para los temas de investigación de la universidad colombiana, sin duda alguna, generará beneficios económicos y científicos para el gremio caficultor nacional. La comprensión de estos organismos puede servir para idear estrategias de erradicación o inhibición de estos organismos, los cuales generan daños en los cultivos de café, especialmente en el centro del país.spa
dc.description.abstracteng:Bioinformatics has been consolidated as a modern tool, which, based on computational methods and large databases, allows to carry out genomic, transcriptonic and proteomic analyzes. Its importance lies in fact that the biological analysis of data becomes faster and economically feasible, which without any doubt constitutes a great advance in the research of functional and structural genomics. In the same way, bioinformatics allow to provide valuable inferences from the evolutionary point of view, especially with fungi population, of which just five stable groups are distinguished, according to a classification based on their reproductive organs. The present project proposes a methodology for the classification of proteins from strategies based on semi-supervised machine learning, which is tested on UniProtKB / Swiss-Prot databases. Proteins are just partially analyzed, that is, they contain labeled (analyzed) data and unlabeled data (without any protein sequence analysis). This document addresses the current state of the research topic, explains basic concepts of molecular biology and bioinformatics such as: amino acids, proteins, molecular functions, genetic ontology, protein analysis, semi-supervised machine learning, vector machines support, training and classification of protein sequences, etc. There is also a detailed step-by-step description of the process carried out: databases structuring, implementation, validation and analysis of the results of two classification models chosen: Transductive Support Vector Machines (TSVM) and classical Support Vector Machines (KSVM). The execution of this project facilitates the understanding of fungal organisms and of course the behavior understanding of the fungus “Hemileia vastatrix” also called "coffee rust". This biological organism is of special interest for the Colombian university research and without any doubt will generate economic and scientific benefits for the national coffee grower union. Understanding these organisms can be used to devise strategies to eradicate or inhibit these organisms which damage coffee crops especially in the center of the country.eng
dc.description.tableofcontents1 INTRODUCCIÓN/ 1.1 CAMPO TEMÁTICO / 1.2 PLANTEAMIENTO DEL PROBLEMA / 1.3 JUSTIFICACIÓN/ 1.4 OBJETIVOS / 1.4.1 OBJETIVO GENERAL/ 1.4.2 OBJETIVOS ESPECÍFICOS / 2 MARCO TEÓRICO Y ESTADO DEL ARTE / 2.1 CONCEPTOS BÁSICOS SOBRE BIOLOGÍA Y BIOINFORMÁTICA/2.1.1 AMINOÁCIDOS/ 2.1.2 PROTEÍNAS / 2.1.3 ESTRUCTURAS DE LAS PROTEÍNAS/ 2.1.4 FUNCIONES MOLECULARES DE LAS PROTEÍNAS/ 2.2 INFORMACIÓN SECUENCIAL/ 2.3 CARACTERIZACIÓN DE PROTEINAS/ 2.4 ONTOLOGÍA GENÉTICA Y FUNCIONES PROTEICAS / 2.5 TEORÍA DEL ANÁLISIS DE PROTEÍNAS/ 2.6 CLASIFICACIÓN DE SECUENCIAS PROTEICAS/ 2.7 APRENDIZAJE DE MÁQUINA/ 2.8 MÁQUINAS DE VECTORES DE SOPORTE – SVM / 2.8.1 CASO LINEALMENTE SEPARABLE/2.8.2 CASO LINEALMENTE NO SEPARABLE PARA KSVM (KERNEL NO LINEAL). / 2.8.3 MODELO TSVM -– PROCEDIMIENTO CÓNCAVO-CONVEXO Y ALGORITMO “UNIVERSAL TRANSDUCTIVE SUPPORT VECTOR MACHINE UTSVM”./ 2.8.4 HIPERPARÁMETROS (HP) /70 3 DESCRIPCIÓN DETALLADA DEL PROCESO / 3.1 MATERIALES Y MÉTODOS/ 3.1.1 BASES DE DATOS/.1.2 METODOLOGÍA GENERAL / 3.2 DISEÑO DE LA SOLUCIÓN/ 3.2.1 CONSTRUCCIÓN DE LA MATRIZ DE CARACTERÍSTICAS / 3.2.2 CLASIFICACIÓN/3.2.2.1 Definición de clases/ 3.2.2.2 Análisis de proteínas/ 3.2.2.3 Definición de matrices etiquetada y no etiquetada/ 3.2.2.4 Implementación de los modelos utilizados para el entrenamiento y las predicciones/ 3.3 DETALLES DE APLICACIÓN, IMPLEMENTACIÓN Y VALIDACIÓN/ 3.3.1 VALIDACIÓN/ 3.3.2 DESEMPEÑO/ 4 ANÁLISIS DE RESULTADOS / 5 CONCLUSIONES Y RECOMENDACIONES / 5.1 CONCLUSIONES /5.2 RECOMENDACIÓN Y TRABAJOS FUTUROS.Espa
dc.format.mimetypeapplication/pdfspa
dc.language.isoengspa
dc.language.isospaspa
dc.titleMetodología de clasificación de proteínas usando aprendizaje semi-supervisado para la anotación de organismos fúngicos.spa
dc.typeTrabajo de grado - Maestríaspa
dc.contributor.researchgroupGITIR Grupo de Investigación en Tecnologías de la Información y Redes (Categoría A)spa
dc.description.degreelevelMaestríaspa
dc.description.notesSe realizará la publicación de un artículo científico.spa
dc.identifier.instnameUniversidad de Caldasspa
dc.identifier.reponameRepositorio institucional Universidad de Caldasspa
dc.identifier.repourlhttps://repositorio.ucaldas.edu.co/spa
dc.publisher.facultyFacultad de Ingenieríaspa
dc.publisher.placeManizalesspa
dc.relation.referencesAlberts, B., Johnson, A., Lewis, J., Ra_, M., Roberts, K., and Walter, P. (1997). Molecular Biology of the Cell (Garland Science, New York, 2002).spa
dc.relation.referencesAl-Shahib, A., Breitling, R., & Gilbert, D. R. (2007). Predicting protein function by machine learning on amino acid sequences--a critical evaluation. BMC genomics, 8, 78. doi:10.1186/1471-2164-8-78spa
dc.relation.referencesAvelino, J., Cristancho, M., Georgiou, S., Imbach, P., Aguilar, L., Bornemann, G., & Morales, C. (2015). The coffee rust crises in Colombia and Central América (2008–2013): impacts, plausible causes and proposed solutions. Food Security, 7(2), 303-321.spa
dc.relation.referencesBall, G. R., & Srihari, S. N. (2009). Semi-supervised Learning for Handwriting Recognition. 2009 10th International Conference on Document Analysis and Recognition, 26-30.spa
dc.relation.referencesBennett, K. and Demiriz, A. Semi-supervised support vector machines. In M. S. Kearns, S. A. Solla, and D. A. Cohn, editors, Advances in Neural Information Processing Systems 12, pages 368-374. MIT Press, Cambridge, MA, 1998.spa
dc.relation.referencesBi, R., Zhou, Y., Lu, F., & Wang, W. (2006). Predicting Gene Ontology functions based on support vector machines and statistical significance estimation. Neurocomputing, 70, 718-725. doi:10.1016/j.neucom.2006.10.006spa
dc.relation.referencesBoser, E. Guyon, I. M. and Vapnik, V. N. A training algorithm for optimal margin classi_ers. In Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory, pages 144-152, Pittsburgh, PA, 1992. ACM Press.spa
dc.relation.referencesCardona, A. Pineda, J. (2015). Metodología para la predicción de funciones en proteínas Embryophyta usando kernels de secuencias. Trabajo de grado de Ingeniería Mecatrónica Instituto Tecnológico Metropolitano: Medellín. 58 p.spa
dc.relation.referencesCastillo, L. F., López-Gartner, G., Isaza, G. A., Sánchez, M., Arango, J., Agudelo-Valencia, D., & Castaño, S. (2015). GITIRBio: A Semantic and Distributed Service Oriented - Architecture for Bioinformatics Pipeline. Journal of integrative bioinformatics, 12(1), 255.spa
dc.relation.referencesCai, C. Z., Han, L. Y., Ji, Z. L., Chen, X., & Chen, Y. Z. (2003). SVM-Prot: web-based support vector machine software for functional classification of a protein from its primary sequence. Nucleic acids research, 31(13), 3692-3697. doi:10.1093/nar/gkg600spa
dc.relation.referencesCamon, E., Magrane, M., Barrell, D., Lee, V., Dimmer, E., Maslen, J., Binns, D., et al. (2004). The Gene Ontology Annotation (GOA) Database: sharing knowledge in Uniprot with Gene Ontology. Nucleic acids research, 32(Database issue), D262--6. doi:10.1093/nar/gkh021spa
dc.relation.referencesChapelle, O., & Zien, A. (2005). Semi-Supervised Classification by Low Density Separation. Proceedings of the Tenth International Workshop on Artificial Intelligence and Statistics (pp. 57–64).spa
dc.relation.referencesChawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2002). SMOTE: synthetic minority over-sampling technique. Journal of artificial intelligence research, 16(1), 321- 357.spa
dc.relation.referencesCheng, V., & Li, C. H. (2006). Personalized Spam Filtering with Semi-supervised Classifier Ensemble Classification of emails using SVM and naïve Bayes Classifier. Intelligence, 0-6.spa
dc.relation.referencesChou, K.-C., & Shen, H.-B. (2010). Plant-mPLoc: a top-down strategy to augment the power for predicting plant protein subcellular localization. PloS one, 5(6), e11335. doi:10.1371/journal.pone.0011335spa
dc.relation.referencesCollobert, R. Sinz, Fabian. Weston, Jason. Bottou, L. (2006). Largue Scale Transductive SVMs. Journal of Machine Learning Research. 1687-1712. 26 p.spa
dc.relation.referencesCollobert, R. Sinz, F. Weston, J. and Bottou, L. Trading convexity for scalability. In ICML '06: Proceedings of the 23rd international conference on Machine learning, pages 201- 208, New York, NY, USA, 2006. ACM Press.spa
dc.relation.referencesComité de Cafeteros de Antioquia. (2018). Colombia es el país con menor prevalencia de roya del cafeto en el mundo. Medellín: Federación Nacional de Cafeteros Antióquia. Recuperado de https://fncantioquia.org/colombia-es-el-pais-con-menor-prevalencia-deroya-del-cafeto-en-el-mundo/.spa
dc.relation.referencesConesa, A., & Götz, S. (2008). Blast2GO: A Comprehensive Suite for Functional Analysis in Plant Genomics. International journal of plant genomics, 2008, 619832. doi:10.1155/2008/619832spa
dc.relation.referencesCristancho, M. A., Rozo, Y., Escobar, C., Rivillas, C. A., & Gaitán, A. L. (2012). Outbreak of coffee leaf rust (Hemileia vastatrix) in Colombia. New Disease Reports, 25, 19.spa
dc.relation.referencesCristancho, M. A., Botero-Rozo, D. O., Giraldo, W., Tabima, J., Riaño-Pachón, D. M., Escobar, C., & Eilam, T. (2014a). Annotation of a hybrid partial genome of the coffee rust (Hemileia vastatrix) contributes to the gene repertoire catalog of the Pucciniales. Frontiers in plant science, 5, 594.spa
dc.relation.referencesCristancho, M., Giraldo, W., Botero, D., Tabima, J., Ortiz, D., Peralta, A., & Riaño, D. (2014b). Application of Genome Studies of Coffee Rust. In Advances in Computational Biology (pp. 133-139). Springer International Publishing.spa
dc.relation.referencesDevelopers. (2019). Developers. Mexico: machine–learning. Recuperado de: (https://developers.google.com/machine-learning/glossary?hl=es-419).spa
dc.relation.referencesDocsity. 2019. Aminoácidos escenciales, Apuntes de Biología Celular. Centro Mexicano de Estomatología: docsity.com. Recuperado de https://www.docsity.com/es /aminoacidosescenciales/5141782/spa
dc.relation.referencesDuan, K., Keerthi, S. S., & Poo, A. N. (2003). Evaluation of simple performance measures for tuning SVM hyperparameters. Neurocomputing, 51, 41-59.spa
dc.relation.referencesEl Quindiano. (2020). Quindío tiene los niveles más altos de roya del café en Colombia. Armenia: El quindiano. Recuperado de https://www.elquindiano.com/noticia/17253/.spa
dc.relation.referencesEmanuelsson, O. and Nielsen, H. and Brunak, S. and von Heijne, G. (2000). Predicting subcellular localization of proteins based on their N-terminal amino acid sequence, Journal of molecular Biology 300 (4). Elsevier.spa
dc.relation.referencesEskin, E., Weston, J., Noble, W. S., & Leslie, C. S. (2002). Mismatch string kernels for SVM protein classification. In Advances in neural information processing systems (pp. 1417- 1424).spa
dc.relation.referencesEstética médica. (2020). Guía Ortomolécular. Buenos Aires: esteticamedica. Recuperado de: http://www.esteticamedica.info/noticias/val/89-51/las-investigaciones-de-paulingen-biologia-molecular.htmlspa
dc.relation.referencesGálvez. (2017). Hidden-nature. Sevilla: nombre de la página web. Recuperado de https://www.hidden-nature.com-cual-es-la-estructura-de-los-aminoacidos.spa
dc.relation.referencesGao, Xianwei. Hu, Changzhen. Shan, Chun. Liu, Baoxu. Niu, Zequn. Xie, Hui. (2020). Malware classification for the cloud via semi supervised transfer learning. ScienceDirect Journal of Information Security and Applications. Beijing. 13p.spa
dc.relation.referencesGenome 2020. Genome. Kyoto University Bioinformatics Center: Aaindex. Recuperado de http://www.genome.jp/aaindex/spa
dc.relation.referencesGuarnizo. (2015) Metodología para la selección de la métrica de distancia en Neighborhood Kernels para clasificación semi-supervisada de secuencias proteicas. Bioinformática. Tesis de Maestría. Facultad de Ingeniería, Instituto Tecnológico Metropolitano: Medellín. 96 p.spa
dc.relation.referencesHan, Zhezhe. Li, Jian. Zhang, Biao. Hossain, Moinul. Xu, Chuanlong. (2020). Predicttion of combustión state throung a semi-supervised learning model and flame imaging. ScienceDirect Journal of Information in Fuel. Nanking. 15pspa
dc.relation.referencesJaramillo-Garzón, J., Gallardo-Chacón, J., Castellanos-Domínguez, C. and Perera-Lluna, A. (2013). Predictability of gene ontology slim-terms from primary structure information in Embryophyta plant proteins. BMC Bioinformatics 2013. 14:68.spa
dc.relation.referencesJensen, L. J., Gupta, R., Staerfeldt, H. H., & Brunak, S. (2003). Prediction of human protein function according to Gene Ontology categories. Bioinformatics, 19(5), 635-642.spa
dc.relation.referencesJian, Meng & Jung, Cheolkon. (2020). Semi-supervised kernel Matrix Learning Using Adaptative Constraint-Based Seed Propagation, Pattern Recognition. Journal Pre-proof. ScienceDirect. Beijing. 21 pspa
dc.relation.referencesJoachims, T. Making large-scale support vector machine learning practical. In B. Schöolkopf, C. Burges, and A. Smola, editors, Advances in Kernel Methods. The MIT Press, 1999a.spa
dc.relation.referencesJoachims, T. Transductive inference for text classi_cation using support vector machines. In International Conference on Machine Learning, ICML, 1999b.spa
dc.relation.referencesJung, J., & Thon, M. R. (2008, December). Gene function prediction using protein domain probability and hierarchical gene ontology information. In Pattern Recognition, 2008. ICPR 2008. 19th International Conference on (pp. 1-4). IEEE. doi:10.1109/ICPR.2008.4761737spa
dc.relation.referencesJung, J., Yi, G., Sukno, S. a, & Thon, M. R. (2010). PoGO: Prediction of Gene Ontology terms for fungal proteins. BMC bioinformatics, 11, 215. doi:10.1186/1471-2105-11-215spa
dc.relation.referencesKawashima, S. and Kanehisa, M. (2000). AAindex: amino acid index database. Nucleic acids research, 28(1):374-374. 47, 57spa
dc.relation.referencesKing, R. D., Wise, P. H., & Clare, A. (2004). Confirmation of data mining based predictions of protein function. Bioinformatics (Oxford, England), 20(7), 1110-1118. doi:10.1093/bioinformatics/bth047.spa
dc.relation.referencesKing, B. R. (2009). Protein sequence classification with Bayesian supervised and semisupervised learned classifiers. Evaluation. STATE UNIVERSITY OF NEW YORK AT ALBANY. Retrieved from http://gradworks.umi.com/33/38/3338851.htmlspa
dc.relation.referencesKrause, N. and Singer, Y. Leveraging the margin more carefully. In International Conference on Machine Learning, ICML, 2004.spa
dc.relation.referencesKuksa, P. P., Huang, P. H., & Pavlovic, V. (2009). Scalable algorithms for string kernels with inexact matching. In Advances in Neural Information Processing Systems (pp. 881- 888).spa
dc.relation.referencesLe Thi, H. A. Analyse num_erique des algorithmes de l'optimisation D.C. Approches locales et globale. Codes et simulations num_eriques en grande dimension. Applications. PhD thesis, INSA, Rouen, 1994.spa
dc.relation.referencesLeCun, Y. Bottou, L. Orr, G. B. and Müller, K.-R. E_cient backprop. In G.B. Orr and K.-R. Müller, editors, Neural Networks: Tricks of the Trade, pages 9{50. Springer, 1998.spa
dc.relation.referencesLeslie, C. S., Eskin, E., & Noble, W. S. (2002, January). The spectrum kernel: A string kernel for SVM protein classification. In Pacific symposium on biocomputing (Vol. 7, pp. 566-575).spa
dc.relation.referencesLi, Zerui. Kang, Yu. Feng, Deyong. Wang, Xing-Mou. Lv, Wenjun. Chang, Ji. Zheng, Wei Xing. Semi-supervised learning for lithology identification using Laplacian support vector machine. Elsevier Journal of Petroleum Science and Engineering. Hefei. 13p.spa
dc.relation.referencesLi, Wenjuan. Meng, Weizhi. Au, Man Ho. (). Enhancing collaborative intrusion detection via disagreement-based semi-supervised learning in IoT enviroments. Elsevier Journal of Network and Computer Applicaions. Hong Kong. 9p.spa
dc.relation.referencesLi, T., Yang, J., Peng, X., Chen, Z., & Luo, C. (2008). Prediction and Early Warning Method for Flea Beetle Based on Semi-supervised Learning Algorithm. 2008 Fourth International Conference on Natural Computation, 217-221.spa
dc.relation.referencesLi, W. & Godzik, A. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics, 22(13):1658–1659, 2006.spa
dc.relation.referencesLodhi, H., Saunders, C., Shawe-Taylor, J., Cristianini, N., & Watkins, C. (2002). Text classification using string kernels. The Journal of Machine Learning Research, 2, 419-444.spa
dc.relation.referencesLongstaff, B., Reddy, S., & Estrin, D. (2010). Improving Activity Classification for Health Applications on Mobile Devices using Active and Semi-Supervised Learning.spa
dc.relation.referencesMartínez. (2017). Udec. Concepción: jmartinez Capitulo 6. Recuperado de http://www2.udec.cl/~jmartine/img00141.gifspa
dc.relation.referencesMason, L. Bartlett, P. L. and Baxter, J. Improved generalization through explicit optimization of margins. Machine Learning, 38(3):243-255, 2000.spa
dc.relation.referencesNational Human Genome Research Institute. (2006). Wikimedia Commons. Maryland: uaeh. Recuperado de https://www.uaeh.edu.mx/scige/boletin /icbi/n1/multimedia /e7/e7_3.jpgspa
dc.relation.referencesNucleic Acid Research. (2020). Nucleic Acid Research. Oxford: academic. Recuperado de https://academic.oup.com/nar.spa
dc.relation.referencesPlatt, J. (1999). Fast training of support vector machines using sequential minimal optimization. Advances in kernel methods—support vector learning, 3.spa
dc.relation.referencesPredictiva. (2020). Predictiva. Medellín: Aprendizaje Semi-Supervisado. Recuperado de http://www.predictiva.com.co/blog-predictiva/aprendizaje-semi-supervisado.spa
dc.relation.referencesQuackenbush, J., Cho, J., Lee, D., Liang, F., Holt, I., Karamycheva, S., & White, J. (2001). The TIGR Gene Indices: analysis of gene transcript sequences in highly sampled eukaryotic species. Nucleic Acids Research,29(1), 159-164.spa
dc.relation.referencesQuickGO. 2020. QuickGo. Instituto Europeo de Bioinformática (EMBL-EBI) Cambridge, UK: ebi.ac.uk. Recuperado de: https://www.ebi.ac.uk/QuickGO/term/GO:...spa
dc.relation.referencesReyes, A. (2015, 16 de marzo). Biología computacional en colombia ¿cómo vamos? Sistemas. Recuperado de https://sistemas.uniandes.edu.co/biologia-computacional-encolombia-como-vamos/spa
dc.relation.referencesRaisman. (2007). Hipertextos del área de la Biología. Argentina: Biología. Recuperado de http://www.biologia.edu.ar/macromoleculas/structup.htmspa
dc.relation.referencesScicluna. 2011. Boom’in Science. Georgia: boominscience.weebly.com. Recuperado de http://boominscience.weebly.com/blog/3d-diagram-of-the-cellspa
dc.relation.referencesShen, X. Tseng, G. C. Zhang, X. and Wong, W. H. On (psi)-learning. Journal of the American Statistical Association, 98(463):724{734, 2003.spa
dc.relation.referencesShimizu, K., Hirose, S., and Noguchi, T. (2007). POODLE-S: web application for predicting protein disorder by using physicochemical features and reduced amino acid set of a position-speci_c scoring matrix. Bioinformatics, 23(17):2337-2338. 41, 42, 48spa
dc.relation.referencesSmall, I. and Peeters, N. and Legeai, F. and Lurin, C (2004). Predotar: A tool for rapidly screening proteomes for N-terminal targeting sequences. Proteomics, 4 (6), 1581-1590, Wiley Online Libraryspa
dc.relation.referencesSmola, A. J. Vishwanathan, S. V. N. and Hofmann, T. Kernel methods for missing variables. In Proceedings of the Tenth International Workshop on Arti_cial Intelligence and Statistics, 2005.spa
dc.relation.referencesUNAM. (2020). Curso para la UNAM, Ciudad de México: Educapedia.org. Recuperado de https://cursoparalaunam.com/enlace-peptidico.spa
dc.relation.referencesUniprot. (2020). Uniprot. Cambridge UK: Uniprot.org. Recuperado de https://www.uniprot.org/spa
dc.relation.referencesUniversidad de Caldas (2009). Plan de desarrollo 2009 – 2018. Centro Editorial Universidad de Caldas, Manizales.spa
dc.relation.referencesUribe. (2017). Detección de proteínas desordenadas. Tesis de PhD. Programa Doctoral en Ingeniería Electrónica y Ciencias de la Computación, Universidad de Antioquia: Medellín. 238 p.spa
dc.relation.referencesV. Vapnik. The Nature of Statistical Learning Theory. Springer, second edition, 1995.spa
dc.relation.referencesVapnik, V. and Cortes, C. (1995). Support-vector networks. Machine Learning, 20(3):273{297. 42, 47, 100spa
dc.relation.referencesV. N. Vapnik. Estimation of Dependences Based on Empirical Data. Springer Verlag Series in Statistics. Springer Verlag, 1982.spa
dc.relation.referencesVargas. (2017). SlidePlayer. California: PROTEINAS De todo, un poco o las prolifuncionales…. Recuperado de http://slideplayer.es.spa
dc.relation.referencesYuille, A.L. and Rangarajan, A. The concave-convex procedure (CCCP). In T. G. Dietterich, S. Becker, and Z. Ghahramani, editors, Advances in Neural Information Processing Systems 14, Cambridge, MA, 2002. MIT Press.spa
dc.relation.referencesZhu, X., & Goldberg, A. B. (2009). Introduction to Semi-Supervised Learning. Synthesis Lectures on Artificial Intelligence and Machine Learning, 3(1), 1-130.spa
dc.rights.accessrightsinfo:eu-repo/semantics/closedAccessspa
dc.subject.lembBiología molecular
dc.subject.lembAnálisis de sistemas
dc.subject.lembProteínas
dc.subject.proposalsemi-supervisadospa
dc.subject.proposalProteinasspa
dc.subject.proposalAprendizajespa
dc.subject.proposalFungispa
dc.subject.proposalAnotaciónspa
dc.subject.proposalBioinformaticseng
dc.subject.proposalTransductivasspa
dc.type.coarhttp://purl.org/coar/resource_type/c_bdccspa
dc.type.contentTextspa
dc.type.driverinfo:eu-repo/semantics/masterThesisspa
dc.type.redcolhttps://purl.org/redcol/resource_type/TMspa
dc.type.versioninfo:eu-repo/semantics/publishedVersionspa
oaire.versionhttp://purl.org/coar/version/c_ab4af688f83e57aaspa
oaire.accessrightshttp://purl.org/coar/access_right/c_14cbspa
dc.description.degreenameMagister en Ingeniería Computacionalspa
dc.publisher.programMaestría en Ingeniería Computacionalspa
dc.description.researchgroupProcesamiento de secuencias biológicas y bioinformáticaspa


Ficheros en el ítem

Thumbnail
Thumbnail
Thumbnail

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem