MEGI Mestrado em Estatística e Gestão da Informação Master Program in Statistics and Information Management Implementação do algoritmo PLS-SEM em R Inês Câncio Reis Pinto Dissertação apresentada como requisito parcial para obtenção do Grau de Mestre em Estatística e Gestão de Informação NOVA Information Management School Instituto Superior de Estatística e Gestão da Informação Universidade Nova de Lisboa Prof. Doutor Jorge M. Mendes, Orientador Implementação do algoritmo PLS-SEM em R Copyright © Inês Câncio Reis Pinto, Instituto Superior de Estatística e Gestão da Informação, Universidade Nova de Lisboa. A Instituto Superior de Estatística e Gestão da Informação e a Universidade Nova de Lisboa têm o direito, perpétuo e sem limites geográficos, de arquivar e publicar esta dissertação através de exemplares impressos reproduzidos em papeloudeformadigital,ouporqualqueroutromeioconhecidoouquevenha a ser inventado, e de a divulgar através de repositórios científicos e de admitir a sua cópia e distribuição com objetivos educacionais ou de investigação, não comerciais, desde que seja dado crédito ao autor e editor. Estedocumentofoigeradoutilizandooprocessador(pdf)LATEX,combasenotemplate“unlthesis”[1]desenvolvidonoDep.InformáticadaFCT-NOVA [2]. [1]https://github.com/joaomlourenco/unlthesis [2]http://www.di.fct.unl.pt Resumo O seguinte trabalho foi desenvolvido no âmbito da estatística computacional com o objetivodeimplementaroalgoritmoPLS-SEM(PartialLeastSquaresStructuralEqua- tionModeling)naplataformaR.Paraprogramaroalgoritmoforamexploradasoutras funcionalidadesdoRemalternativaaospacotesjáexistentes. Quanto à estrutura do trabalho, a primeira parte dedica-se ao enquadramento que teve na base a revisão da principal literatura relacionada com o tema. Em seguida é apresentadaametodologiaadotada,nomeadamenteosprocedimentosenvolvidosno cálculodoalgoritmo,eumadescriçãododesenvolvimentodosoftware.Posteriormente foram testados dois subconjuntos de dados para o modelo experimental e modelo ECSI. Utilizando outros programas disponíveis,foi possível estabelecer uma análise comparativadosresultadosobtidos.Estesnãoapresentaramdiferençasrelevantes,o quelevouaumaavaliaçãopositivasobredesempenhodocódigo. Para além dos resultados favoráveis, o novo programa permite adequar facilmente osparâmetrosàsexigênciasdoutilizadoraquandoaestimaçãodométodoPLS-SEM. Igualmenteapresentaavantagemdeserumalinguagemsimpleseacessívelenquanto códigoaberto.Aimportânciadousodestametodologiatemespecialdestaquenoapu- ramentodosíndicesdesatisfaçãodocliente,sendoquenoatualcontextodomercado deveseradaptadoerevistoparafazerfaceaosnovosparadigmas.Énestesentidoque opresentetrabalhodisponibilizalivrementeoseucontributoàcomunidadecientífica emviadodesenvolvimentoeaperfeiçoamentodatécnica. Palavras-chave: StructualEquationModels,PartialLeastSquares,R,ECSI vii Abstract The work here presented within the field of computational statistics had the goal of implementing PLS-SEM algorithm in the R software. As an alternative to the existing packages, new functionalities were explored. Concerning the work’s structure, the first part lays down a review on the lit- erature related to this theme. The methodology is then presented, namely the proceduresthatleadtotheconstructionofthealgorithmandalsoadescription of the software development. Two datasets where used to test both experimen- tal model and ECSI model. A comparative analysis of the achieved results was possible using other available programmes. The outputs presented no dissimi- larities, which led to evaluate positively the code’s performance. Good results aside, the new program foresees the estimation of the PLS-SEM method simply by adjusting the parameters to the user’s requirements. As an open source, it also has the advantage of being a simple and manageable language. This method is important for the calculation of customer satisfaction index. In the market field, this approach can be adapted and reviewed so it can meet up the new circumstances. Due to this fact, the work presented shares its conclusions with the scientific community for the purpose of developing and perfecting this technique. Keywords: Structual Equation Models, Partial Least Squares, R, ECSI ix
Description: