Estudo comparativo entre os Softwares R e Matlab na estatística

Autores

  • Raquel Nailê Brinkhus Uninter
  • Guilherme Augusto Pianezzer Uninter

Resumo

O presente trabalho realizou uma análise comparativa entre os softwares R e Matlab. Inicialmente, verificou-se que ambos apresentam vantagens similares, como a fácil utilização e a boa interface gráfica; quanto às desvantagens, constatou-se que o Matlab tem um alto custo de aquisição e o software R um tempo de processamento maior — quando comparado a outras linguagens. Subsequentemente, realizou-se um levantamento das principais funções da análise estatística, a saber: a média, mediana, valor máximo, valor mínimo, desvio padrão e variância. Efetuaram-se dez testes de tempo de processamento de cada uma destas rotinas nos softwares, para duas populações de dados; logo após, calculou-se a média dos dados encontrados. Os resultados indicaram que, para o cálculo da média, mediana, valor máximo e valor mínimo, o tempo de execução foi menor no software Matlab; já para o cálculo do desvio padrão e variância, o tempo menor ocorreu no software R. Destarte, para os casos estudados, a diferença entre resultados aumenta com o crescimento da população; isto é, caso o volume de dados a serem analisados aumente, a diferença no tempo de execução tende a ser maior.

Palavras-chave: linguagem R; linguagem Matlab; estatística; velocidade de processamento.

Abstract

The present work performed a comparative analysis between R and Matlab software. Initially, it was found that the programs have similar advantages, such as ease of use and good graphical interface; as for the disadvantages, it was found that Matlab has a high acquisition cost and the R software a longer processing time — when compared to other languages. Subsequently, a survey of the main functions of the statistical analysis was carried out, namely: the mean, median, maximum value, minimum value, standard deviation and variance. Ten processing time tests were performed for each of these routines in the software, for two data populations; soon after, the average of the data found was calculated. The results indicated that for calculating the mean, median, maximum and minimum values, the execution time was shorter in Matlab software; for calculating of standard deviation and variance, the execution time was shorter in the R software. Thus, for the cases studied, the difference between results increases with population growth; that is, if more data is analyzed, the tendency is for the difference in execution time to be even greater.

Keywords: R language; Matlab language; statistics; processing speed.

Resumen

El presente trabajo realizó un análisis comparativo entre los softwares R y Matlab. Inicialmente, se verificó que ambos presentan ventajas similares, como una fácil utilización y buena interfaz gráfica; sobre las desventajas, se constató que el Matlab tiene un alto costo de adquisición y el software R un tiempo de procesamiento más largo — cuando comparado a otros lenguajes. Luego, se hizo una recopilación de las principales funciones del análisis estadístico, a saber: media, mediana, valor máximo, valor mínimo, desviación estándar y varianza. Se hicieron diez pruebas de tiempo de procesamiento para cada una de esas rutinas en los softwares, con dos poblaciones de datos; en seguida, se calculó la media de los datos encontrados. Los resultados indicaron que, para el cálculo de la media, mediana, valor máximo y valor mínimo, el tiempo de ejecución fue más corto en el software Matlab; en cambio, para el cálculo de la desviación estándar y la varianza, el tiempo más corto se dio en el software R. Así, para los casos estudiados, la diferencia entre resultados aumenta con el crecimiento de la población; es decir, si el volumen de datos a ser analizados aumenta, la diferencia en el tiempo de ejecución tiende a ser más largo.

Palabras-clave: lenguaje R; lenguaje Matlab; estadística; velocidad de procesamiento.

Downloads

Não há dados estatísticos.

Biografia do Autor

Raquel Nailê Brinkhus, Uninter

Mestre em Cálculo Estrutural pela UFRGS, professora da CESURG - Sarandi e acadêmica do curso de bacharelado de Matemática do Centro Universitário Internacional UNINTER.

Guilherme Augusto Pianezzer, Uninter

Doutor em Métodos Numéricos em Engenharia pela UFPR. Docente na área de Exatas do Centro Universitário Internacional UNINTER.

Referências

BARROS, Anna Carolina et al. Análise de séries temporais em R: curso introdutório. Rio de Janeiro: Elsevier; FGV IBRE, 2018.

BECKER, João L. Estatística básica: transformando dados em informação. Porto Alegre: Bookman, 2015.

CHAPMAN, Stephen. J. Programação em MATLAB para engenheiros. 5. ed. São Paulo: Cengage Learning, 2016.

COSTA NETO, Pedro L. de O. Estatística. 3. ed. São Paulo: Edgard Blücher, 2002.

FARIA, Pedro D.; PARGA, João P. F. A. Introdução à linguagem R: seus fundamentos e sua prática. 1. ed. Belo Horizonte: [s.n.], 2020. Disponível em: https://pedro-faria.netlify.app/pt/publication/book/introducao_linguagem_r/. Acesso em: 03 ago. 2021.

GILAT, Amos. MATLAB com aplicações em engenharia. 4. ed. Porto Alegre: Bookman, 2012.

OLIVEIRA, P. F. de; GUERRA, S.; MCDONNELL, R. Ciência de Dados com R: Introdução. Brasília: IBPAD, 2018.

SILVIA, Juliane S. F. da; GRAMS, Ana L. B.; SILVEIRA, J. F. Estatística. Porto Alegre: SAGAH, 2018.

VIRGILLITO, Salvatore B. Estatística aplicada. 1. ed. São Paulo: Saraiva, 2017.

Downloads

Publicado

2021-08-20