Universidade Federal do Espírito Santo Centro de Ciências Agrárias e Engenharias XXVIII SEMANA AGRONÔMICA
VALIDAÇÃO DOS MÉTODOS DE AGRUPAMENTO HIERÁRQUICO PARA AS INFORMAÇÕES MUNICIPAIS DE PASTAGEM NO ESPÍRITO SANTO
Allison Queiroz de Oliveira1, Maristela de Oliveira Bauer2, Juliana Di Giorgio Giannotti3
Universidade Federal do Espírito Santo/Departamento de Engenharia Rural, Alto Universitário, s/nº - Guararema, Alegre - ES | CEP 29500-000 [email protected], [email protected], [email protected]
Resumo - O objetivo deste trabalho foi avaliar, de acordo com o coeficiente de correlação cofenética (CCC) qual método de agrupamento hierárquico produziu um resultado mais consistente para reunir os municípios do estado do Espírito Santo de acordo com as informações de pastagem (áreas com pastagens naturais, degradadas e com forrageiras) presentes no censo agropecuário do IBGE. Os dados foram padronizados e submetidos à análise de agrupamento usando cinco métodos hierárquicos (Ward, ligação completa, ligação média, ligação simples, centróide). O CCC foi significativo para todos os métodos sendo que o valor mais próximo de um foi para o método da ligação simples. Recomenda-se o CCC para avaliar a consistência do método de agrupamento.
Palavras-chave: áreas com pasto, coeficiente de correlação cofenética, métodos hierárquicos de agrupamento.
Introdução
A análise multivariada pode ser definida como um conjunto de métodos estatísticos que analisam mais de uma medida, simultaneamente, sobre o objeto em estudo (HAIR et al., 2005). Dentro da análise multivariada, a análise de agrupamento é um método cuja finalidade é agregar objetos com base nas similaridades das características/variáveis que eles possuem (JOHNSON & WICHERN, 1998). Há diferentes maneiras de se agregar estes objetos, seja utilizando métodos hierárquicos ou não hierárquicos e um problema recorrente, nos dois métodos, é definir o número adequado de grupos. Uma medida de validação do método de agrupamento é o coeficiente de correlação cofenética (CCC), o qual compara as distâncias observadas e previstas entre os objetos (BARROSO & ARTES, 2003). Neste trabalho o objetivo foi avaliar, mediante a aplicação do CCC, qual o método hierárquico de agrupamento produziu um resultado mais consistente com relação aos grupos de municípios agregados, considerando as variáveis de pastagem, em nível municipal, para o estado do Espírito Santo.
28ª SEAGRO
Metodologia
A base de dados foi formada pelas variáveis áreas (em hectares) dos municípios do Estado do Espírito Santo com: pastagens naturais; pastagens plantadas degradadas; pastagens plantadas em boas condições e; área plantada com forrageiras para corte. Essas informações foram obtidas do censo agropecuário 2006 (IBGE, 2017). Iniciou-se a análise de agrupamento com a padronização das variáveis, subtração da média e divisão pelo desvio padrão para cada uma delas (HAIR et al., 2005). A matriz de distância euclidiana obtida foi usada como medida de similaridade para a análise de agrupamento dos municípios cujos métodos hierárquicos empregados foram: Ward; ligação completa; ligação média; ligação simples; centróide. Assim, para cada método foi gerado um dendrograma. A fim de avaliar qual método apresentou melhor consistência no agrupamento calculou- se o CCC. Este coeficiente mede o quanto a matriz das distâncias euclidianas e a matriz resultante do método de agrupamento estão ajustadas. O melhor ajuste se dá para um maior valor do CCC, deste modo, valores próximos da unidade indicam a melhor adequação do método (BARROSO & ARTES, 2003). Comparou-se os resultados dos CCC dentro de cada método de agrupamento por meio do teste t, a 5% de probabilidade. Todas as análises estatísticas dos dados foram realizadas no programa computacional de acesso livre R (R DEVELOPMENT CORE TEAM, 2015).
Resultados e Discussão
O CCC foi significativo para todos os métodos (p-valor <0,05) e seu valor foi: 0,6949 para Ward; 0,9574 para ligação simples; 0,9314 para ligação completa; 0,9490 para ligação média; 0,9498 para centróide. O valor mais alto do CCC foi para o método da ligação simples, assim pode-se recomendar este método para realizar a análise de agrupamento. Porém os métodos da ligação média, da ligação completa e do centróide apresentaram bons resultados quanto à magnitude do valor do CCC, todos acima de 0,70 e próximos de um. Na Figura 1 estão os dendrogramas gerados para cada um dos métodos de agrupamento. Por este resultado pode-se observar que os dendrogramas gerados pelos métodos da ligação simples e da ligação média tem semelhanças, assim como os
28ª SEAGRO dendrogramas dos métodos da ligação completa e do centróide. O método de Ward foi o que apresentou o pior resultado quanto à consistência do agrupamento, e seu dendrograma mostrou apresentou-se diferenças com relação aos demais.
Ligação Simples Ligação Média
4
8
3
6
2
4
1
2
0
0
Iúna
Irupi
Serra
Viana
Muqui
Irupi
Iúna
Vitória
Piúma
Alegre
Ibiraçu
Ibatiba
Iconha
Apiacá
Itarana
Guaçuí
Serra
Pancas
Castelo
Fundão
Aracruz
Viana
Muqui
Jaguaré
Vitória
Piúma
Mucurici
Colatina
Alegre
Itaguaçu
Ibitirama
Ibatiba
Ibiraçu
Iconha
Linhares
Anchieta
Apiacá
Itarana
Guaçuí
Pancas
Cariacica
Pinheiros
Aracruz
Castelo
Fundão
Brejetuba
Montanha
Guarapari
Jaguaré
VilaVelha
Mucurici
Colatina
Itapemirim
Ibitirama
Itaguaçu
Marilândia
Linhares
Anchieta
VilaPavão
PontoBelo
Sooretama
Marataízes
JoãoNeiva
Cariacica
Pinheiros
VilaValério
Brejetuba
SãoMateus
Guarapari
Montanha
VilaVelha
Ecoporanga
VargemAlta
Itapemirim
MunizFreire
RioBananal
Marilândia
VilaPavão
PontoBelo
Marataízes
Sooretama
JoãoNeiva
SantaTeresa
VilaValério
ÁguiaBranca
Mantenópolis
Alto RioAlto Novo
SãoMateus
NovaVenécia
Ecoporanga
VargemAlta
BaixoGuandu
MunizFreire
RioBananal
PedroCanário
AtilioVivacqua
MimosodoSul
SantaTeresa
AfonsoCláudio
AlfredoChaves
BoaEsperança
ÁguiaBranca
Mantenópolis
Alto RioAlto Novo
NovaVenécia
BaixoGuandu
RioNovo doSul
PedroCanário
LaranjadaTerra
AtilioVivacqua
MimosodoSul
BoaEsperança
AlfredoChaves
AfonsoCláudio
SantaLeopoldina
MarechalFloriano
DomingosMartins
RioNovo doSul
JerônimoMonteiro
LaranjadaTerra
DoresdoRio Preto
SantaLeopoldina
ConceiçãodaBarra
Bom JesusBomdo Norte
DomingosMartins
MarechalFloriano
ÁguaDoce doNorte
PresidenteKennedy
JerônimoMonteiro
DoresdoRio Preto
SãoJosédo Calçado
SãoGabriel daPalha
SantaMaria deJetibá
SãoRoque doCanaã
ConceiçãodaBarra
ConceiçãodoCastelo
Bom JesusBomdo Norte
ÁguaDoce doNorte
PresidenteKennedy
BarradeSão Francisco
SãoGabriel daPalha
SãoJosédo Calçado
SãoRoque doCanaã
SantaMaria deJetibá
GovernadorLindenberg
SãoDomingos doNorte
DivinodeSão Lourenço
ConceiçãodoCastelo
CachoeirodeItapemirim
VendaNova doImigrante
BarradeSão Francisco
GovernadorLindenberg
SãoDomingos doNorte
DivinodeSão Lourenço CachoeirodeItapemirim VendaNova doImigrante
Ligação Completa Centróide
6
9
4
6
2
3
0
0
Irupi
Iúna
Irupi
Iúna
Serra
Serra
Viana
Viana
Muqui
Muqui
Vitória
Piúma
Vitória
Piúma
Alegre
Alegre
Ibatiba
Ibiraçu
Iconha
Ibatiba
Ibiraçu
Iconha
Itarana
Itarana
Apiacá
Apiacá
Guaçuí
Guaçuí
Pancas
Pancas
Aracruz
Aracruz
Fundão
Fundão
Castelo
Castelo
Jaguaré
Jaguaré
Mucurici
Mucurici
Colatina
Colatina
Ibitirama
Ibitirama
Itaguaçu
Itaguaçu
Linhares
Anchieta
Anchieta
Linhares
Cariacica
Cariacica
Pinheiros
Pinheiros
Brejetuba
Brejetuba
Guarapari
Guarapari
Montanha
Montanha
VilaVelha
VilaVelha
Itapemirim
Itapemirim
Marilândia
Marilândia
VilaPavão
VilaPavão
Marataízes
Sooretama
Marataízes
Sooretama
PontoBelo
PontoBelo
JoãoNeiva
JoãoNeiva
VilaValério
VilaValério
SãoMateus
SãoMateus
Ecoporanga
VargemAlta
VargemAlta
Ecoporanga
MunizFreire
RioBananal
RioBananal
MunizFreire
SantaTeresa
SantaTeresa
ÁguiaBranca
Mantenópolis
Mantenópolis
ÁguiaBranca
Alto RioAlto Novo
Alto RioAlto Novo
NovaVenécia
NovaVenécia
BaixoGuandu
BaixoGuandu
PedroCanário
PedroCanário
AtilioVivacqua
AtilioVivacqua
MimosodoSul
MimosodoSul
AlfredoChaves
BoaEsperança
BoaEsperança
AlfredoChaves
AfonsoCláudio
AfonsoCláudio
RioNovo doSul
RioNovo doSul
LaranjadaTerra
LaranjadaTerra
SantaLeopoldina
SantaLeopoldina
DomingosMartins
DomingosMartins
MarechalFloriano
MarechalFloriano
JerônimoMonteiro
JerônimoMonteiro
DoresdoRio Preto
DoresdoRio Preto
ConceiçãodaBarra
ConceiçãodaBarra
Bom JesusBomdo Norte
Bom JesusBomdo Norte
ÁguaDoce doNorte
ÁguaDoce doNorte
PresidenteKennedy
PresidenteKennedy
SãoGabriel daPalha
SãoGabriel daPalha
SãoJosédo Calçado
SãoJosédo Calçado
SantaMaria deJetibá
SãoRoque doCanaã
SantaMaria deJetibá
SãoRoque doCanaã
ConceiçãodoCastelo
ConceiçãodoCastelo
BarradeSão Francisco
BarradeSão Francisco
GovernadorLindenberg
SãoDomingos doNorte
GovernadorLindenberg
SãoDomingos doNorte
DivinodeSão Lourenço
DivinodeSão Lourenço
CachoeirodeItapemirim
CachoeirodeItapemirim VendaNova doImigrante VendaNova doImigrante Ward
40
30
20
10
0
Irupi
Iúna
Serra
Viana
Muqui
Vitória
Piúma
Alegre
Ibatiba
Ibiraçu
Iconha
Apiacá
Itarana
Guaçuí
Pancas
Aracruz
Castelo
Fundão
Jaguaré
Mucurici
Colatina
Itaguaçu
Ibitirama
Anchieta
Linhares
Cariacica
Pinheiros
Brejetuba
Guarapari
Montanha
VilaVelha
Itapemirim
Marilândia
VilaPavão
Marataízes
Sooretama
PontoBelo
JoãoNeiva
VilaValério
SãoMateus
VargemAlta
Ecoporanga
MunizFreire
RioBananal
SantaTeresa
ÁguiaBranca
Mantenópolis
Alto RioAlto Novo
NovaVenécia
BaixoGuandu
PedroCanário
AtilioVivacqua
MimosodoSul
AfonsoCláudio
AlfredoChaves
BoaEsperança
RioNovo doSul
LaranjadaTerra
SantaLeopoldina
DomingosMartins
MarechalFloriano
JerônimoMonteiro
DoresdoRio Preto
ConceiçãodaBarra
Bom JesusBomdo Norte
ÁguaDoce doNorte
PresidenteKennedy
SãoGabriel daPalha
SãoJosédo Calçado
SantaMaria deJetibá
SãoRoque doCanaã
ConceiçãodoCastelo
BarradeSão Francisco
GovernadorLindenberg
SãoDomingos doNorte
DivinodeSão Lourenço CachoeirodeItapemirim VendaNova doImigrante Figura 1- Dendrogramas do agrupamento dos municípios pelos métodos de agrupamento hierárquicos ligação simples, ligação completa, ligação média, centroide e Ward. Fonte: Dados de pesquisa.
Cargnelutti Filho et al (2010) utilizaram a diferentes matrizes de similaridade e o CCC como método para avaliar a consistência de agrupamento em cultivares de feijão. Esses autores concluíram que o método da ligação média baseado na distância euclidiana foi o que apresentou maior coeficiente. Silva e Dias (2010) utilizaram o método de Tocher para
28ª SEAGRO obtenção da correlação cofenética em estudos de cultivares de alho. Encontraram valores de correlação mais baixos para o método de Ward e mais alto para o método de Tocher, ambos baseados na distância euclidiana. E concluíram que comparações entre agrupamentos podem ser realizadas utilizando como critério valores do CCC. Tais estudos estão em consonância com os resultados encontrados neste trabalho.
Conclusão
Recomenda-se o uso do coeficiente de correlação cofenética como maneira de validar a consistência e escolher o método para realizar a análise de agrupamento.
Referências
BARROSO, L.P.; ARTES, R. Análise Multivariada. Lavras: UFLA, 2003.
CARGNELUTTI FILHO, A.; RIBEIRO, N. D.; BURIN, C. Consistência do padrão de agrupamento de cultivares de feijão conforme medidas de dissimilaridade e métodos de agrupamento. Pesquisa agropecuária brasileira, Brasília, v. 45, n. 3, p. 236-243, mar. 2010.
HAIR, J.F.JR.; ANDERSON, R.E.; TATHAM, R.L.; BLACK, W.C. Análise multivariada de dados. Porto Alegre: Bookman, 2005.
IBGE. Instituto Brasileiro de Geografia e Estatística. Censo Agropecuário, 2006. Disponível em:
JOHNSON, R.A.; WICHERN, D.W. Applied Multivariate Statistical Analysis. New Jersey: Editora Prentice Hall, 1998.
R CORE TEAM (2015). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. Disponível em:
SILVA, A. R.; DIAS, C.T.S. A cophenetic correlation coefficient for Tocher's method. Pesquisa agropecuária brasileira, Brasília, v. 48, n. 6, p. 589-596, jun. 2013.