A proposed method for grouping uni- and multivariate treatments using Mahalanobis distance and cluster analysis

Zygmunt Kaczmarek

office@igr.poznan.pl
Instytut Genetyki Roślin PAN, Poznań (Poland)

Stanisław Czajka


Katedra Metod Matematycznych i Statystycznych, Uniwersytetu Przyrodniczego w Poznaniu (Poland)

Elżbieta Adamska


Instytut Genetyki Roślin PAN, Poznań (Poland)

Abstract

A method for grouping the multivariate normal treatments with common covariance matrix is proposed. The method is applicable in cluster analysis and utilizes the Mahalanobis distance as a of measure similarity of two treatments. It is based on the successive merging of two most similar samples taken from the treatments in the sense of minimal distance between them. The “least significant distance” is used as the criterion to determine a stopping rule for the grouping uni- and multivariate treatments. A numerical example from the winter oilseed rape data is included to illustrate the proposed method.


Keywords:

ANOVA, MANOVA, cluster analysis, grouping of treatments, least significant distance, Mahalanobis distance

Caliński T. 1964. On the application of cluster analysis to experimental results W: proceedings of the 37th Session of the International Statistical Institute ISI, London.
Google Scholar

Caliński T., Czajka S., Kaczmarek Z. 1975. Analiza składowych głównych i jej zastosowania. Roczniki AR w Poznaniu, Algorytmy biometryczne i statystyczne, 36: 159 — 185.
Google Scholar

Caliński T., Dyczkowski A., Kaczmarek Z. 1976. Testowanie hipotez w wielozmiennej analizie wariancji i kowariancji. Roczniki AR w Poznaniu, Algorytmy biometryczne i statystyczne 45: 77 — 94.
Google Scholar

Caliński T., Dyczkowski A I Sitek M.(1979). Procedury testów jednoczesnych w wielozmiennej analizie wariancji. Matematyka stosowana XIV: 5 — 31.
Google Scholar

Caliński T., Harabasz J. S. 1974. A dendrite method for cluster analysis. Communications in Statistics 3.
Google Scholar

Caliński T., Kaczmarek Z.1969. A note the calculation and use of the generalized distance between multivariate samples. Zeszyty Naukowe UAM, Geografia 8: 7 —17.
Google Scholar

Caliński T., Kaczmarek Z. 1973. Metody kompleksowej analizy doświadczenia wielocechowego W: Trzecie Colloquim Metodologiczne z Agrobiometrii, PAN, PTB Warszawa, 258 —320.
Google Scholar

Caliński T., Karoński M. 1977. Grupowanie populacji o wielorozkładowych rozkładach normalnych za pomocą procedury testów jednoczesnych. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 56: 123 — 134.
Google Scholar

Caliński T., Wagner W. 1974. Grupowanie średnich obiektowych w jednozmiennej analizie wariancji. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 24: 61 — 73.
Google Scholar

Camussi A., Ottaviano E., Caliński T., Kaczmarek Z. 1985. Genetic distances based on quantitative traits. Genetics 111: 945 —962.
Google Scholar

Chudzik H., Karoński M.1979. Skupianie obserwacji metodą k-średnich. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 78: 133 – 152.
Google Scholar

Gabriel K. R. 1964. A procedure for testing the homogeneity of all sets of means in analysis of variance. Biometrics, vol. 20, 3: 459 —477.
Google Scholar

Gabriel K. R. 1968. Simultaneous test procedures in multivariate analysis of variance. Biometrika 55: 489 —504.
Google Scholar

Górczyński J., Mądry W. 1988. A study of genetic divergence of plants by multivariate methods. Genetica Polonica, vol. 29, No 3–4: 341 —352.
Google Scholar

Harabasz J. S., Karoński M. 1977. Dendrytowa metoda analizy skupień. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne, 57: 135 — 148.
Google Scholar

Harabasz J. S., Wiśniewski P. 1984. Grupowanie obiektów jednocechowych za pomocą programowania dynamicznego. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 109: 147 — 154.
Google Scholar

Karoński M. 1971. Algorytm grupowania populacji w rozkładach metodą krok po kroku.. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 4: 30 — 33.
Google Scholar

Karoński M., Caliński T. 1973. Grupowanie populacji o rozkładach normalnych na podstawie odległości Mahalanobisa. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne, 16, 107 — 115.
Google Scholar

Karoński M., Caliński T. 1973. Grupowanie obiektów wielocechowych na podstawie odległości euklidesowych. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 17: 117 — 129.
Google Scholar

Lance G. M., Williams W. T. 1967. A general theory of classificatory sorting strategies. Hierarchical systems, Computer J. 9: 373 —380.
Google Scholar

Mac Queen J. B. 1967. Some methods for classification and analysis of multivariate observations. Proc. Fifth Berkeley Symposium on Mathematical Statistics and Probability Theory. Berkeley University of California Press. vol. 1, 281 — 287.
Google Scholar

Mardia K. V., Kent J. T., Bibby J. M. 1979. Multivariate Analysis. Academic Press, London.
Google Scholar

Morrison D. F. 1976. Multivariate statistical methods. McGraw-Hill, New York.
Google Scholar

Mądry W., Kubicka H. 1988. Wielocechowa ocena zróżnicowania linii wsobnych wyselekcjonowanych z odmian uprawnych żyta ozimego (S. cereale L.). Hod. Rośl. Aklim. i Nasien. 32, 3/4: 16 — 26.
Google Scholar

Rohlf F. J. 1970. Adaptive hierarchical clustering schemes. Syst. Zool. 19: 58 — 82.
Google Scholar

Rajfura A., Mądry W. 2000. Wydzielenie grup jednocechowo podrzędnych w środowiskach w stosunku do genotypów wykazujących interakcję jakościową. Biul. IHAR 216: 27 — 37.
Google Scholar

Seber G. A. F. 1984. Multivariate Observations. Wiley, New York.
Google Scholar

Wishart D. 1969. An algorithm for hierarchical classifications. Biometrics 25, 1: 165 — 170.
Google Scholar


Published
2008-09-30

Cited by

Kaczmarek, Z., Czajka, S. and Adamska, E. (2008) “A proposed method for grouping uni- and multivariate treatments using Mahalanobis distance and cluster analysis”, Bulletin of Plant Breeding and Acclimatization Institute, (249), pp. 9–10. doi: 10.37317/biul-2008-0028.

Authors

Zygmunt Kaczmarek 
office@igr.poznan.pl
Instytut Genetyki Roślin PAN, Poznań Poland

Authors

Stanisław Czajka 

Katedra Metod Matematycznych i Statystycznych, Uniwersytetu Przyrodniczego w Poznaniu Poland

Authors

Elżbieta Adamska 

Instytut Genetyki Roślin PAN, Poznań Poland

Statistics

Abstract views: 105
PDF downloads: 32


License

Copyright (c) 2008 Zygmunt Kaczmarek, Stanisław Czajka, Elżbieta Adamska

Creative Commons License

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Upon submitting the article, the Authors grant the Publisher a non-exclusive and free license to use the article for an indefinite period of time throughout the world in the following fields of use:

  1. Production and reproduction of copies of the article using a specific technique, including printing and digital technology.
  2. Placing on the market, lending or renting the original or copies of the article.
  3. Public performance, exhibition, display, reproduction, broadcasting and re-broadcasting, as well as making the article publicly available in such a way that everyone can access it at a place and time of their choice.
  4. Including the article in a collective work.
  5. Uploading an article in electronic form to electronic platforms or otherwise introducing an article in electronic form to the Internet or other network.
  6. Dissemination of the article in electronic form on the Internet or other network, in collective work as well as independently.
  7. Making the article available in an electronic version in such a way that everyone can access it at a place and time of their choice, in particular via the Internet.

Authors by sending a request for publication:

  1. They consent to the publication of the article in the journal,
  2. They agree to give the publication a DOI (Digital Object Identifier),
  3. They undertake to comply with the publishing house's code of ethics in accordance with the guidelines of the Committee on Publication Ethics (COPE), (http://ihar.edu.pl/biblioteka_i_wydawnictwa.php),
  4. They consent to the articles being made available in electronic form under the CC BY-SA 4.0 license, in open access,
  5. They agree to send article metadata to commercial and non-commercial journal indexing databases.

Most read articles by the same author(s)

1 2 > >>