Propozycja metody grupowania obiektów jedno- i wielocechowych z zastosowaniem odległości Mahalanobisa i analizy skupień
Zygmunt Kaczmarek
office@igr.poznan.plInstytut Genetyki Roślin PAN, Poznań (Poland)
Stanisław Czajka
Katedra Metod Matematycznych i Statystycznych, Uniwersytetu Przyrodniczego w Poznaniu (Poland)
Elżbieta Adamska
Instytut Genetyki Roślin PAN, Poznań (Poland)
Abstrakt
Praca zawiera propozycję metody grupowania wielocechowych obiektów o rozkładach normalnych ze wspólną macierzą kowariancji. Metoda ta jest stosowana w analizie skupień i wykorzystuje odległości Mahalanobisa jako miarę podobieństwa dwóch obiektów. Grupowanie polega na łączeniu obiektów najbardziej do siebie podobnych, czyli takich między którymi odległość Mahalamnobisa jest najmniejsza. Jako kryterium zastopowania procesu grupowania, zarówno w przypadku obiektów wielocechowych jak i jednocechowych, przyjęto „najmniejszą istotną odległość” wyznaczoną każdorazowo dla porównywanych obiektów. Prezentowana metoda jest zilustrowana przykładem numerycznym grupowania linii DH rzepaku ozimego.
Słowa kluczowe:
ANOVA, MANOVA, analiza skupień, grupowanie obiektów, najmniejsza istotna odległość, odległość MahalanobisaBibliografia
Caliński T. 1964. On the application of cluster analysis to experimental results W: proceedings of the 37th Session of the International Statistical Institute ISI, London.
Google Scholar
Caliński T., Czajka S., Kaczmarek Z. 1975. Analiza składowych głównych i jej zastosowania. Roczniki AR w Poznaniu, Algorytmy biometryczne i statystyczne, 36: 159 — 185.
Google Scholar
Caliński T., Dyczkowski A., Kaczmarek Z. 1976. Testowanie hipotez w wielozmiennej analizie wariancji i kowariancji. Roczniki AR w Poznaniu, Algorytmy biometryczne i statystyczne 45: 77 — 94.
Google Scholar
Caliński T., Dyczkowski A I Sitek M.(1979). Procedury testów jednoczesnych w wielozmiennej analizie wariancji. Matematyka stosowana XIV: 5 — 31.
Google Scholar
Caliński T., Harabasz J. S. 1974. A dendrite method for cluster analysis. Communications in Statistics 3.
Google Scholar
Caliński T., Kaczmarek Z.1969. A note the calculation and use of the generalized distance between multivariate samples. Zeszyty Naukowe UAM, Geografia 8: 7 —17.
Google Scholar
Caliński T., Kaczmarek Z. 1973. Metody kompleksowej analizy doświadczenia wielocechowego W: Trzecie Colloquim Metodologiczne z Agrobiometrii, PAN, PTB Warszawa, 258 —320.
Google Scholar
Caliński T., Karoński M. 1977. Grupowanie populacji o wielorozkładowych rozkładach normalnych za pomocą procedury testów jednoczesnych. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 56: 123 — 134.
Google Scholar
Caliński T., Wagner W. 1974. Grupowanie średnich obiektowych w jednozmiennej analizie wariancji. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 24: 61 — 73.
Google Scholar
Camussi A., Ottaviano E., Caliński T., Kaczmarek Z. 1985. Genetic distances based on quantitative traits. Genetics 111: 945 —962.
Google Scholar
Chudzik H., Karoński M.1979. Skupianie obserwacji metodą k-średnich. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 78: 133 – 152.
Google Scholar
Gabriel K. R. 1964. A procedure for testing the homogeneity of all sets of means in analysis of variance. Biometrics, vol. 20, 3: 459 —477.
Google Scholar
Gabriel K. R. 1968. Simultaneous test procedures in multivariate analysis of variance. Biometrika 55: 489 —504.
Google Scholar
Górczyński J., Mądry W. 1988. A study of genetic divergence of plants by multivariate methods. Genetica Polonica, vol. 29, No 3–4: 341 —352.
Google Scholar
Harabasz J. S., Karoński M. 1977. Dendrytowa metoda analizy skupień. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne, 57: 135 — 148.
Google Scholar
Harabasz J. S., Wiśniewski P. 1984. Grupowanie obiektów jednocechowych za pomocą programowania dynamicznego. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 109: 147 — 154.
Google Scholar
Karoński M. 1971. Algorytm grupowania populacji w rozkładach metodą krok po kroku.. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 4: 30 — 33.
Google Scholar
Karoński M., Caliński T. 1973. Grupowanie populacji o rozkładach normalnych na podstawie odległości Mahalanobisa. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne, 16, 107 — 115.
Google Scholar
Karoński M., Caliński T. 1973. Grupowanie obiektów wielocechowych na podstawie odległości euklidesowych. Roczniki AR w Poznaniu. Algorytmy biometryczne i statystyczne 17: 117 — 129.
Google Scholar
Lance G. M., Williams W. T. 1967. A general theory of classificatory sorting strategies. Hierarchical systems, Computer J. 9: 373 —380.
Google Scholar
Mac Queen J. B. 1967. Some methods for classification and analysis of multivariate observations. Proc. Fifth Berkeley Symposium on Mathematical Statistics and Probability Theory. Berkeley University of California Press. vol. 1, 281 — 287.
Google Scholar
Mardia K. V., Kent J. T., Bibby J. M. 1979. Multivariate Analysis. Academic Press, London.
Google Scholar
Morrison D. F. 1976. Multivariate statistical methods. McGraw-Hill, New York.
Google Scholar
Mądry W., Kubicka H. 1988. Wielocechowa ocena zróżnicowania linii wsobnych wyselekcjonowanych z odmian uprawnych żyta ozimego (S. cereale L.). Hod. Rośl. Aklim. i Nasien. 32, 3/4: 16 — 26.
Google Scholar
Rohlf F. J. 1970. Adaptive hierarchical clustering schemes. Syst. Zool. 19: 58 — 82.
Google Scholar
Rajfura A., Mądry W. 2000. Wydzielenie grup jednocechowo podrzędnych w środowiskach w stosunku do genotypów wykazujących interakcję jakościową. Biul. IHAR 216: 27 — 37.
Google Scholar
Seber G. A. F. 1984. Multivariate Observations. Wiley, New York.
Google Scholar
Wishart D. 1969. An algorithm for hierarchical classifications. Biometrics 25, 1: 165 — 170.
Google Scholar
Autorzy
Stanisław CzajkaKatedra Metod Matematycznych i Statystycznych, Uniwersytetu Przyrodniczego w Poznaniu Poland
Autorzy
Elżbieta AdamskaInstytut Genetyki Roślin PAN, Poznań Poland
Statystyki
Abstract views: 111PDF downloads: 33
Licencja
Prawa autorskie (c) 2008 Zygmunt Kaczmarek, Stanisław Czajka, Elżbieta Adamska
Utwór dostępny jest na licencji Creative Commons Uznanie autorstwa – Na tych samych warunkach 4.0 Miedzynarodowe.
Z chwilą przekazania artykułu, Autorzy udzielają Wydawcy niewyłącznej i nieodpłatnej licencji na korzystanie z artykułu przez czas nieokreślony na terytorium całego świata na następujących polach eksploatacji:
- Wytwarzanie i zwielokrotnianie określoną techniką egzemplarzy artykułu, w tym techniką drukarską oraz techniką cyfrową.
- Wprowadzanie do obrotu, użyczenie lub najem oryginału albo egzemplarzy artykułu.
- Publiczne wykonanie, wystawienie, wyświetlenie, odtworzenie oraz nadawanie i reemitowanie, a także publiczne udostępnianie artykułu w taki sposób, aby każdy mógł mieć do niego dostęp w miejscu i w czasie przez siebie wybranym.
- Włączenie artykułu w skład utworu zbiorowego.
- Wprowadzanie artykułu w postaci elektronicznej na platformy elektroniczne lub inne wprowadzanie artykułu w postaci elektronicznej do Internetu, lub innej sieci.
- Rozpowszechnianie artykułu w postaci elektronicznej w internecie lub innej sieci, w pracy zbiorowej jak również samodzielnie.
- Udostępnianie artykułu w wersji elektronicznej w taki sposób, by każdy mógł mieć do niego dostęp w miejscu i czasie przez siebie wybranym, w szczególności za pośrednictwem Internetu.
Autorzy poprzez przesłanie wniosku o publikację:
- Wyrażają zgodę na publikację artykułu w czasopiśmie,
- Wyrażają zgodę na nadanie publikacji DOI (Digital Object Identifier),
- Zobowiązują się do przestrzegania kodeksu etycznego wydawnictwa zgodnego z wytycznymi Komitetu do spraw Etyki Publikacyjnej COPE (ang. Committee on Publication Ethics), (http://ihar.edu.pl/biblioteka_i_wydawnictwa.php),
- Wyrażają zgodę na udostępniane artykułu w formie elektronicznej na mocy licencji CC BY-SA 4.0, w otwartym dostępie (open access),
- Wyrażają zgodę na wysyłanie metadanych artykułu do komercyjnych i niekomercyjnych baz danych indeksujących czasopisma.
Inne teksty tego samego autora
- Laurencja Szała, Zygmunt Kaczmarek, Elżbieta Adamska, Teresa Cegielska-Taras, Wpływ kierunku krzyżowania na ekspresję barwy nasion i cech składowych plonu w populacjach linii DH rzepaku ozimego , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 264 (2012): Wydanie regularne
- Tadeusz Adamski, Andrzej Bichoński, Zdzisław Biliński, Zbigniew Bystry, Piotr Jarosz, Dorota Jasińska, Zygmunt Kaczmarek, Karolina Krystkowiak, Anetta Kuczyńska, Wojciech Mikulski, Barbara Nowak, Wanda Orłowska-Job, Zdzisław Paszkiewicz, Michał Rębarz, Maria Surma, Anna Sybilska, Renata Trzeciak, Interakcja genotypowo-środowiskowa rodów jęczmienia z różnych hodowli , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 249 (2008): Wydanie regularne
- Tadeusz Adamski, Zygmunt Kaczmarek, Maria Surma, Anetta Kuczyńska, Karolina Krystkowiak, Bolesław Salmanowicz, Renata Trzeciak, Zofia Banaszak, Bogusława Ługowska, Małgorzata Majcher, Wiktor Obuchowski, Wielocechowa analiza wybranych cech jakości ziarna pszenicy ozimej , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 260/261 (2011): Wydanie regularne
- Katarzyna Pankiewicz, Wojciech Rybiński, Zygmunt Kaczmarek, Ocena zmienności fenotypowej i molekularnej okrągłonasiennej formy lędźwianu siewnego (Lathyrus sativus L.) , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 260/261 (2011): Wydanie regularne
- Maria Surma, Tadeusz Adamski, Zygmunt Kaczmarek, Paweł Krajewski, Genetyka ilościowa — przegląd przez stulecie , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 250 (2008): Wydanie regularne
- Prof. dr hab. Tadeusz Adamski , Maria Surma, Zygmunt Kaczmarek, Anetta Kuczyńska, Krzysztof Mikołajczak, Michał Kempa, Piotr Ogrodowicz, Elżbieta Adamska, Renata Trzeciak, Alina Anioła, Renata Holewińska , Badania nad wpływem translokacji 1B/1R na efektywność uzyskiwania linii DH pszenicy oraz ich wartość technologiczną , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 286 (2019): Wydanie specjalne
- Zygmunt Kaczmarek, Laurencja Szała, Elżbieta Adamska, Teresa Cegielska-Taras, Statystyczna i genetyczna ocena linii DH rzepaku ozimego na podstawie wyników doświadczenia jednopowtórzeniowego z wzorcami , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 253 (2009): Wydanie regularne
- Karolina Krystkowiak, Tadeusz Adamski, Maria Surma, Zygmunt Kaczmarek, Anetta Kuczyńska, Agata Burtna, Renata Trzeciak, Zmienność wybranych cech technologicznych ziarna mieszańców pszenicy ozimej w zależności od składu podjednostek białek gluteninowych u form rodzicielskich , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 260/261 (2011): Wydanie regularne
- Karolina Krystkowiak, Tadeusz Adamski, Maria Surma, Zygmunt Kaczmarek, Anetta Kuczyńska, Ocena zróżnicowania odmian pszenicy pod względem cech użytkowych z wykorzystaniem jedno- i wielowymiarowych metod statystycznych , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 253 (2009): Wydanie regularne
- Zygmunt Kaczmarek, Dariusz R. Mańkowski, Wprowadzenie do statystycznych analiz wielozmiennych. Część I. Podstawy teoretyczne , Biuletyn Instytutu Hodowli i Aklimatyzacji Roślin: Nr 259 (2011): Wydanie regularne