Hierarchical vs Partitional Clustering

Þyrping er vélanámstækni til að greina gögn og deila í hópa af svipuðum gögnum. Þessir hópar eða mengi af svipuðum gögnum eru þekkt sem þyrping. Klasagreining lítur á algrím þyrpinga sem geta greint klasa sjálfkrafa. Stigveldi og skipting eru tveir slíkir flokkar þyrpingar reiknirita. Stigveldar þyrpingarreitir brjóta gögnin upp í stigveldi þyrpinga. Skilgreining reiknirit skiptir gögnum sem sett eru í samsíða skipting.

Hvað er hierarchic clustering?

Hierarchic þyrping reiknirit endurtaka hringrás annað hvort sameina smærri þyrping í stærri eða deila stærri þyrpingum í smærri. Hvort heldur sem er framleiðir það stigveldi þyrpinga sem kallast dendogram. Samanlags þyrpingarstefna notar botn-upp aðferð við að sameina þyrpingar í stærri en deilandi þyrpingarstefna notar topp-niður aðferð til að skipta niður í smærri. Venjulega er gráðug aðferðin notuð við ákvörðun um hvaða stærri / minni þyrpingar eru notaðar til að sameina / skipta. Fjarlægð evrópskra fjarlægða, fjarlægð frá Manhattan og líkneski líkinda eru nokkrar af algengustu tölfræðilegum tölum fyrir töluleg gögn. Fyrir tölur sem ekki eru tölulegar eru notaðir tölur eins og Hamming fjarlægð. Það er mikilvægt að hafa í huga að raunverulegar athuganir (tilvik) eru ekki nauðsynlegar fyrir stigvelda þyrpingu, því aðeins fylki fjarlægðar er nægjanlegt. Dendogram er sjónræn framsetning klasanna sem sýnir stigveldið mjög skýrt. Notandinn getur fengið mismunandi þyrpingu eftir því stigi sem skjalið er skorið á.

Hvað er skipting þyrping?

Skipting algrím fyrir skipting mynda ýmsar skipting og meta þær síðan eftir einhverju viðmiði. Þeim er einnig vísað til sem nonhierarchical þar sem hvert tilvik er sett í nákvæmlega einn af k innbyrðis útilokuðum þyrpingum. Vegna þess að aðeins eitt sett af þyrpingum er framleiðsla dæmigerðs skiptingartengd algrím er notandanum gert að setja inn þann fjölda klasa sem óskað er eftir (venjulega kallaður k). Eitt af algengustu algrímunum fyrir skipting klasa er k-þýðir þyrpingar reiknirit. Notandi er nauðsynlegur til að gefa upp fjölda þyrpinga (k) áður en byrjað er og reikniritið byrjar fyrst miðstöðvar (eða miðlægar) k-skiptinganna. Í hnotskurn, úthlutar k-þýði þyrpingar reikniriti síðan meðlimum miðað við núverandi miðstöðvar og endurmetur miðstöðvar miðað við núverandi meðlimi. Þessi tvö skref eru endurtekin þangað til ákveðin hlutlæg hlutlægni hlutarhlutfalls og þéttleika hlutlægs klasa eru bjartsýn. Þess vegna er skynsamleg frumstilling miðstöðva mjög mikilvægur þáttur í því að fá gæðaniðurstöður úr skiptingarkerfi algera.

Hver er munurinn á stigveldisflokkun og skipting þyrpingar?

Stigveldi og skipting þyrpingar eru lykilmunur á hlaupatíma, forsendum, innlagsstærðum og afleiðingum klasa. Venjulega er skipting þyrping hraðari en stigvelda þyrping. Stigveldi þyrpingar krefst aðeins líkingarráðstigs, en skipting þyrpingar krefst sterkari forsendna svo sem fjölda þyrpinga og upphafsmiðstöðva. Stigveldar þyrpingar þurfa ekki neinar innslagsbreytur, meðan skipting reiknirit krefst fjölda klasa til að byrja að keyra. Stigveldar þyrpingar skila mun innihaldsríkari og huglægri skiptingu þyrpinga en skipting þyrpingar skilar sér í nákvæmlega k þyrpingum. Stigveldar þyrpingarreitir henta betur fyrir flokkaleg gögn svo framarlega sem hægt er að skilgreina líkingarráð samkvæmt því.