-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathclustering_spectral.tex
22 lines (16 loc) · 1.39 KB
/
clustering_spectral.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
\section{Clustering spectral}
Questa tipologia di clustering nasce dal bisogno di colmare delle mancanze presenti negli altri metodi: i metodi partizionali riescono a creare cluster solamente di forma sferica, basandosi, come abbiamo già visto, sul concetto di centro; mentre i metodi density-based hanno un approccio troppo sensibile ai parametri dati.
Per risolvere questi problemi si utilizza un grafo di similarità che ha come vertici le componenti da clusterizzare e, come valore degli archi, la similarità delle componenti tra cui questi sono sottesi.
Una volta creato il grafo, si procede con una serie di tagli minimi che possono essere individuati con un "taglio normalizzato" secondo la seguente formula:
\begin{equation*}
NormCut(C_1, C_2) = \frac{Cut(C_1, C_2)}{Vol(C_1)} + \frac{Cut(C_1, C_2)}{Vol(C_2)}
\end{equation*}
dove $C_1$, $C_2$ sono due gruppi di nodi e $Cut$ e $Vol$ definiti come segue:
\begin{equation*}
Cut(C_1, C_2) = \sum_{i \in C_1, j \in C_2} {w_{ij}}
\end{equation*}
\begin{equation*}
Vol(C) = \sum_{i \in C, j \in V} {w_{ij}}
\end{equation*}
dove $Cut(C_1, C_2)$ calcola il peso totale delle connessioni tra $C_1$ e $C_2$, $Vol(C)$ calcola il peso totale degli archi originati dal cluster $C$ e $w_{ij}$ indica il peso dell'arco sotteso tra $i$ e $j$.
Uno degli algoritmi più importanti appartenente a questa categoria prende il nome di Spectral\cite{spectral}.