undefined

Improving Clustering and Cluster Validation with Missing Data Using Distance Estimation Methods

Julkaisuvuosi

2022

Tekijät

Niemelä, Marko; Kärkkäinen, Tommi

Tiivistelmä

Missing data introduces a challenge in the field of unsupervised learning. In clustering, when the form and the number of clusters are to be determined, one needs to deal with the missing values both in the clustering process and in the cluster validation. In the previous research, the clustering algorithm has been treated using robust clustering methods and available data strategy, and the cluster validation indices have been computed with the partial distance approximation. However, lately special methods for distance estimation with missing values have been proposed and this work is the first one where these methods are systematically applied and tested in clustering and cluster validation. More precisely, we propose, implement, and analyze the use of distance estimation methods to improve the discrimination power of clustering and cluster validation indices. A novel, robust prototype-based clustering process in two stages is suggested. Our results and conclusions confirm the usefulness of the distance estimation methods in clustering but, surprisingly, not in cluster validation.
Näytä enemmän

Organisaatiot ja tekijät

Jyväskylän yliopisto

Niemelä Marko Orcid -palvelun logo

Kärkkäinen Tommi Orcid -palvelun logo

Julkaisutyyppi

Julkaisumuoto

Artikkeli

Emojulkaisun tyyppi

Kokoomateos

Artikkelin tyyppi

Muu artikkeli

Yleisö

Tieteellinen

Vertaisarvioitu

Vertaisarvioitu

OKM:n julkaisutyyppiluokitus

A3 Kirjan tai muun kokoomateoksen osa

Julkaisukanavan tiedot

Avoin saatavuus

Avoin saatavuus kustantajan palvelussa

Ei

Rinnakkaistallennettu

Kyllä

Muut tiedot

Tieteenalat

Matematiikka; Tietojenkäsittely ja informaatiotieteet

Avainsanat

[object Object],[object Object],[object Object]

Julkaisumaa

Sveitsi

Kustantajan kansainvälisyys

Kansainvälinen

Kieli

englanti

Kansainvälinen yhteisjulkaisu

Ei

Yhteisjulkaisu yrityksen kanssa

Ei

DOI

10.1007/978-3-030-70787-3_9

Julkaisu kuuluu opetus- ja kulttuuriministeriön tiedonkeruuseen

Kyllä