Universidade Federal do Espírito Santo Centro de Ciências Agrárias e Engenharias XXVIII SEMANA AGRONÔMICA

VALIDAÇÃO DOS MÉTODOS DE AGRUPAMENTO HIERÁRQUICO PARA AS INFORMAÇÕES MUNICIPAIS DE PASTAGEM NO ESPÍRITO SANTO

Allison Queiroz de Oliveira1, Maristela de Oliveira Bauer2, Juliana Di Giorgio Giannotti3

Universidade Federal do Espírito Santo/Departamento de Engenharia Rural, Alto Universitário, s/nº - Guararema, Alegre - ES | CEP 29500-000 [email protected], [email protected], [email protected]

Resumo - O objetivo deste trabalho foi avaliar, de acordo com o coeficiente de correlação cofenética (CCC) qual método de agrupamento hierárquico produziu um resultado mais consistente para reunir os municípios do estado do Espírito Santo de acordo com as informações de pastagem (áreas com pastagens naturais, degradadas e com forrageiras) presentes no censo agropecuário do IBGE. Os dados foram padronizados e submetidos à análise de agrupamento usando cinco métodos hierárquicos (Ward, ligação completa, ligação média, ligação simples, centróide). O CCC foi significativo para todos os métodos sendo que o valor mais próximo de um foi para o método da ligação simples. Recomenda-se o CCC para avaliar a consistência do método de agrupamento.

Palavras-chave: áreas com pasto, coeficiente de correlação cofenética, métodos hierárquicos de agrupamento.

Introdução

A análise multivariada pode ser definida como um conjunto de métodos estatísticos que analisam mais de uma medida, simultaneamente, sobre o objeto em estudo (HAIR et al., 2005). Dentro da análise multivariada, a análise de agrupamento é um método cuja finalidade é agregar objetos com base nas similaridades das características/variáveis que eles possuem (JOHNSON & WICHERN, 1998). Há diferentes maneiras de se agregar estes objetos, seja utilizando métodos hierárquicos ou não hierárquicos e um problema recorrente, nos dois métodos, é definir o número adequado de grupos. Uma medida de validação do método de agrupamento é o coeficiente de correlação cofenética (CCC), o qual compara as distâncias observadas e previstas entre os objetos (BARROSO & ARTES, 2003). Neste trabalho o objetivo foi avaliar, mediante a aplicação do CCC, qual o método hierárquico de agrupamento produziu um resultado mais consistente com relação aos grupos de municípios agregados, considerando as variáveis de pastagem, em nível municipal, para o estado do Espírito Santo.

28ª SEAGRO

Metodologia

A base de dados foi formada pelas variáveis áreas (em hectares) dos municípios do Estado do Espírito Santo com: pastagens naturais; pastagens plantadas degradadas; pastagens plantadas em boas condições e; área plantada com forrageiras para corte. Essas informações foram obtidas do censo agropecuário 2006 (IBGE, 2017). Iniciou-se a análise de agrupamento com a padronização das variáveis, subtração da média e divisão pelo desvio padrão para cada uma delas (HAIR et al., 2005). A matriz de distância euclidiana obtida foi usada como medida de similaridade para a análise de agrupamento dos municípios cujos métodos hierárquicos empregados foram: Ward; ligação completa; ligação média; ligação simples; centróide. Assim, para cada método foi gerado um dendrograma. A fim de avaliar qual método apresentou melhor consistência no agrupamento calculou- se o CCC. Este coeficiente mede o quanto a matriz das distâncias euclidianas e a matriz resultante do método de agrupamento estão ajustadas. O melhor ajuste se dá para um maior valor do CCC, deste modo, valores próximos da unidade indicam a melhor adequação do método (BARROSO & ARTES, 2003). Comparou-se os resultados dos CCC dentro de cada método de agrupamento por meio do teste t, a 5% de probabilidade. Todas as análises estatísticas dos dados foram realizadas no programa computacional de acesso livre R (R DEVELOPMENT CORE TEAM, 2015).

Resultados e Discussão

O CCC foi significativo para todos os métodos (p-valor <0,05) e seu valor foi: 0,6949 para Ward; 0,9574 para ligação simples; 0,9314 para ligação completa; 0,9490 para ligação média; 0,9498 para centróide. O valor mais alto do CCC foi para o método da ligação simples, assim pode-se recomendar este método para realizar a análise de agrupamento. Porém os métodos da ligação média, da ligação completa e do centróide apresentaram bons resultados quanto à magnitude do valor do CCC, todos acima de 0,70 e próximos de um. Na Figura 1 estão os dendrogramas gerados para cada um dos métodos de agrupamento. Por este resultado pode-se observar que os dendrogramas gerados pelos métodos da ligação simples e da ligação média tem semelhanças, assim como os

28ª SEAGRO dendrogramas dos métodos da ligação completa e do centróide. O método de Ward foi o que apresentou o pior resultado quanto à consistência do agrupamento, e seu dendrograma mostrou apresentou-se diferenças com relação aos demais.

Ligação Simples Ligação Média

4

8

3

6

2

4

1

2

0

0

Iúna

Irupi

Serra

Viana

Muqui

Irupi

Iúna

Vitória

Piúma

Alegre

Ibiraçu

Ibatiba

Iconha

Apiacá

Itarana

Guaçuí

Serra

Pancas

Castelo

Fundão

Aracruz

Viana

Muqui

Jaguaré

Vitória

Piúma

Mucurici

Colatina

Alegre

Itaguaçu

Ibitirama

Ibatiba

Ibiraçu

Iconha

Linhares

Anchieta

Apiacá

Itarana

Guaçuí

Pancas

Cariacica

Pinheiros

Aracruz

Castelo

Fundão

Brejetuba

Montanha

Guarapari

Jaguaré

VilaVelha

Mucurici

Colatina

Itapemirim

Ibitirama

Itaguaçu

Marilândia

Linhares

Anchieta

VilaPavão

PontoBelo

Sooretama

Marataízes

JoãoNeiva

Cariacica

Pinheiros

VilaValério

Brejetuba

SãoMateus

Guarapari

Montanha

VilaVelha

Ecoporanga

VargemAlta

Itapemirim

MunizFreire

RioBananal

Marilândia

VilaPavão

PontoBelo

Marataízes

Sooretama

JoãoNeiva

SantaTeresa

VilaValério

ÁguiaBranca

Mantenópolis

Alto RioAlto Novo

SãoMateus

NovaVenécia

Ecoporanga

VargemAlta

BaixoGuandu

MunizFreire

RioBananal

PedroCanário

AtilioVivacqua

MimosodoSul

SantaTeresa

AfonsoCláudio

AlfredoChaves

BoaEsperança

ÁguiaBranca

Mantenópolis

Alto RioAlto Novo

NovaVenécia

BaixoGuandu

RioNovo doSul

PedroCanário

LaranjadaTerra

AtilioVivacqua

MimosodoSul

BoaEsperança

AlfredoChaves

AfonsoCláudio

SantaLeopoldina

MarechalFloriano

DomingosMartins

RioNovo doSul

JerônimoMonteiro

LaranjadaTerra

DoresdoRio Preto

SantaLeopoldina

ConceiçãodaBarra

Bom JesusBomdo Norte

DomingosMartins

MarechalFloriano

ÁguaDoce doNorte

PresidenteKennedy

JerônimoMonteiro

DoresdoRio Preto

SãoJosédo Calçado

SãoGabriel daPalha

SantaMaria deJetibá

SãoRoque doCanaã

ConceiçãodaBarra

ConceiçãodoCastelo

Bom JesusBomdo Norte

ÁguaDoce doNorte

PresidenteKennedy

BarradeSão Francisco

SãoGabriel daPalha

SãoJosédo Calçado

SãoRoque doCanaã

SantaMaria deJetibá

GovernadorLindenberg

SãoDomingos doNorte

DivinodeSão Lourenço

ConceiçãodoCastelo

CachoeirodeItapemirim

VendaNova doImigrante

BarradeSão Francisco

GovernadorLindenberg

SãoDomingos doNorte

DivinodeSão Lourenço CachoeirodeItapemirim VendaNova doImigrante

Ligação Completa Centróide

6

9

4

6

2

3

0

0

Irupi

Iúna

Irupi

Iúna

Serra

Serra

Viana

Viana

Muqui

Muqui

Vitória

Piúma

Vitória

Piúma

Alegre

Alegre

Ibatiba

Ibiraçu

Iconha

Ibatiba

Ibiraçu

Iconha

Itarana

Itarana

Apiacá

Apiacá

Guaçuí

Guaçuí

Pancas

Pancas

Aracruz

Aracruz

Fundão

Fundão

Castelo

Castelo

Jaguaré

Jaguaré

Mucurici

Mucurici

Colatina

Colatina

Ibitirama

Ibitirama

Itaguaçu

Itaguaçu

Linhares

Anchieta

Anchieta

Linhares

Cariacica

Cariacica

Pinheiros

Pinheiros

Brejetuba

Brejetuba

Guarapari

Guarapari

Montanha

Montanha

VilaVelha

VilaVelha

Itapemirim

Itapemirim

Marilândia

Marilândia

VilaPavão

VilaPavão

Marataízes

Sooretama

Marataízes

Sooretama

PontoBelo

PontoBelo

JoãoNeiva

JoãoNeiva

VilaValério

VilaValério

SãoMateus

SãoMateus

Ecoporanga

VargemAlta

VargemAlta

Ecoporanga

MunizFreire

RioBananal

RioBananal

MunizFreire

SantaTeresa

SantaTeresa

ÁguiaBranca

Mantenópolis

Mantenópolis

ÁguiaBranca

Alto RioAlto Novo

Alto RioAlto Novo

NovaVenécia

NovaVenécia

BaixoGuandu

BaixoGuandu

PedroCanário

PedroCanário

AtilioVivacqua

AtilioVivacqua

MimosodoSul

MimosodoSul

AlfredoChaves

BoaEsperança

BoaEsperança

AlfredoChaves

AfonsoCláudio

AfonsoCláudio

RioNovo doSul

RioNovo doSul

LaranjadaTerra

LaranjadaTerra

SantaLeopoldina

SantaLeopoldina

DomingosMartins

DomingosMartins

MarechalFloriano

MarechalFloriano

JerônimoMonteiro

JerônimoMonteiro

DoresdoRio Preto

DoresdoRio Preto

ConceiçãodaBarra

ConceiçãodaBarra

Bom JesusBomdo Norte

Bom JesusBomdo Norte

ÁguaDoce doNorte

ÁguaDoce doNorte

PresidenteKennedy

PresidenteKennedy

SãoGabriel daPalha

SãoGabriel daPalha

SãoJosédo Calçado

SãoJosédo Calçado

SantaMaria deJetibá

SãoRoque doCanaã

SantaMaria deJetibá

SãoRoque doCanaã

ConceiçãodoCastelo

ConceiçãodoCastelo

BarradeSão Francisco

BarradeSão Francisco

GovernadorLindenberg

SãoDomingos doNorte

GovernadorLindenberg

SãoDomingos doNorte

DivinodeSão Lourenço

DivinodeSão Lourenço

CachoeirodeItapemirim

CachoeirodeItapemirim VendaNova doImigrante VendaNova doImigrante Ward

40

30

20

10

0

Irupi

Iúna

Serra

Viana

Muqui

Vitória

Piúma

Alegre

Ibatiba

Ibiraçu

Iconha

Apiacá

Itarana

Guaçuí

Pancas

Aracruz

Castelo

Fundão

Jaguaré

Mucurici

Colatina

Itaguaçu

Ibitirama

Anchieta

Linhares

Cariacica

Pinheiros

Brejetuba

Guarapari

Montanha

VilaVelha

Itapemirim

Marilândia

VilaPavão

Marataízes

Sooretama

PontoBelo

JoãoNeiva

VilaValério

SãoMateus

VargemAlta

Ecoporanga

MunizFreire

RioBananal

SantaTeresa

ÁguiaBranca

Mantenópolis

Alto RioAlto Novo

NovaVenécia

BaixoGuandu

PedroCanário

AtilioVivacqua

MimosodoSul

AfonsoCláudio

AlfredoChaves

BoaEsperança

RioNovo doSul

LaranjadaTerra

SantaLeopoldina

DomingosMartins

MarechalFloriano

JerônimoMonteiro

DoresdoRio Preto

ConceiçãodaBarra

Bom JesusBomdo Norte

ÁguaDoce doNorte

PresidenteKennedy

SãoGabriel daPalha

SãoJosédo Calçado

SantaMaria deJetibá

SãoRoque doCanaã

ConceiçãodoCastelo

BarradeSão Francisco

GovernadorLindenberg

SãoDomingos doNorte

DivinodeSão Lourenço CachoeirodeItapemirim VendaNova doImigrante Figura 1- Dendrogramas do agrupamento dos municípios pelos métodos de agrupamento hierárquicos ligação simples, ligação completa, ligação média, centroide e Ward. Fonte: Dados de pesquisa.

Cargnelutti Filho et al (2010) utilizaram a diferentes matrizes de similaridade e o CCC como método para avaliar a consistência de agrupamento em cultivares de feijão. Esses autores concluíram que o método da ligação média baseado na distância euclidiana foi o que apresentou maior coeficiente. Silva e Dias (2010) utilizaram o método de Tocher para

28ª SEAGRO obtenção da correlação cofenética em estudos de cultivares de alho. Encontraram valores de correlação mais baixos para o método de Ward e mais alto para o método de Tocher, ambos baseados na distância euclidiana. E concluíram que comparações entre agrupamentos podem ser realizadas utilizando como critério valores do CCC. Tais estudos estão em consonância com os resultados encontrados neste trabalho.

Conclusão

Recomenda-se o uso do coeficiente de correlação cofenética como maneira de validar a consistência e escolher o método para realizar a análise de agrupamento.

Referências

BARROSO, L.P.; ARTES, R. Análise Multivariada. Lavras: UFLA, 2003.

CARGNELUTTI FILHO, A.; RIBEIRO, N. D.; BURIN, C. Consistência do padrão de agrupamento de cultivares de feijão conforme medidas de dissimilaridade e métodos de agrupamento. Pesquisa agropecuária brasileira, Brasília, v. 45, n. 3, p. 236-243, mar. 2010.

HAIR, J.F.JR.; ANDERSON, R.E.; TATHAM, R.L.; BLACK, W.C. Análise multivariada de dados. Porto Alegre: Bookman, 2005.

IBGE. Instituto Brasileiro de Geografia e Estatística. Censo Agropecuário, 2006. Disponível em: . Acesso em: 20 maio 2017.

JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. New Jersey: Editora Prentice Hall, 1998.

R CORE TEAM (2015). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em: . Acesso em: 10 de julho 2017.

SILVA, A. R.; DIAS, C.T.S. A cophenetic correlation coefficient for Tocher's method. Pesquisa agropecuária brasileira, Brasília, v. 48, n. 6, p. 589-596, jun. 2013.