Hierarkkinen klusterointi on suosituin ja laajimmin käytetty menetelmä sosiaalisen verkoston tietojen analysointiin. Tässä menetelmässä solmuja verrataan toisiinsa niiden samank altaisuuden perusteella. Suuremmat ryhmät rakennetaan yhdistämällä solmuryhmiä niiden samank altaisuuden perusteella.
Milloin käyttää hierarkkista klusterointia vs. K tarkoittaa?
Hierarkinen klusteri on joukko sisäkkäisiä klustereita, jotka on järjestetty puuksi. K Keinojen klusteroinnin on havaittu toimivan hyvin kun klusterien rakenne on hyperpallomainen (kuten ympyrä 2D:ssä, pallo 3D:ssä). Hierarkkinen klusterointi ei toimi yhtä hyvin, k tarkoittaa, kun klusterien muoto on hyperpallomainen.
Milloin minun pitäisi käyttää hierarkkista klusterointia?
Hierarkkinen klusterointi on tehokas tekniikka, jonka avulla voit rakentaa puurakenteita tietojen yhtäläisyyksistä. Voit nyt nähdä, kuinka eri aliklusterit liittyvät toisiinsa ja kuinka kaukana datapisteet ovat toisistaan.
Milloin et käyttäisi hierarkkista klusterointia?
Heikkoudet ovat, että se tarjoaa harvoin parhaan ratkaisun, se sisältää paljon mieliv altaisia päätöksiä, se ei toimi puuttuvien tietojen kanssa, se toimii huonosti sekalaisten tietotyyppien kanssa, se ei toimi hyvin suurilla tietojoukoilla, ja sen päätulos, dendrogrammi, tulkitaan usein väärin.
Mitä etuja hierarkkisesta klusteroinnista on?
Hierarkkisen klusteroinnin vahvuudet
- Onymmärtää ja toteuttaa.
- Meidän ei tarvitse määrittää etukäteen mitään tiettyä määrää klustereita. …
- Ne saattavat vastata mielekästä luokittelua.
- Klusterien lukumäärä on helppo päättää vain katsomalla dendrogrammaa.