density peak clustering algorithm

python implement with sklearn manner.

document

overview

class DensityPeakCluster(object):
    """
    Density Peak Cluster.

    Methods:
        fit: fit model
        plot: plot clustering

    Attributes:
        n_id: data row count
        distance: each id distance
        dc: threshold of density cut off
        rho: each id density
        nneigh: each id min upper density nearest neighbor
        delta: each id min upper density nearest neighbor distance
        labels_: cluster labels_
        center: center id
    """

construct method:

def __init__(self,
             dc=None,
             distance_metric='euclidean',
             silence=True,
             gauss_cutoff=True,
             density_threshold=None,
             distance_threshold=None,
             anormal=True):
    """
    Init parameters for Density peak cluster.

    parameters
    :param dc: local density threshold, None for default select, 'auto' for auto select
    :param distance_metric: distance calculate function, include euclidean, cosine, pearson
    :param silence: print process log
    :param gauss_cutoff: neighbor cutoff function, True for gauss, False for hard cutoff
    :param density_threshold: density threshold to filter center, None for auto
    :param distance_threshold: distance threshold to filter center, None for auto
    :param anormal: differ anormal point to -1
    """

fit method:

def fit(self, data):
    """
    Fit model.

    :param data: data for cluster
    :return: None
    """

plot method:

def plot(self, mode="all", title="", **kwargs):
    """
    Plot cluster.

    :param mode: "decision" to plot decision graph,
        "label" to plot label graph, "all" to plot decision and label graph.
    :param title: title to plot
    :return: None
    """

example:

"""example of density peak cluster algorithm."""
import pandas as pd

from dpca import DensityPeakCluster

# file name
file = "spiral"

# load data
data = pd.read_csv(r"data/data/%s.txt" % file, sep="\t", header=None)

# dpca model
# plot decision graph to set params `density_threshold`, `distance_threshold`.
dpca = DensityPeakCluster(density_threshold=8, distance_threshold=5, anormal=False)

# fit model
dpca.fit(data.iloc[:, [0, 1]])

# print predict label
print(dpca.labels_)

# plot cluster(all to plot decision graph and label graph)
dpca.plot("all", title=file, save_path="data/result")

NOTE

you should plot decision graph to set params density_threshold, distance_threshold first.

reference

cluster result

aggregation

jain

flame

spiral

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.idea		.idea
data		data
dpca		dpca
README.md		README.md
example.py		example.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

density peak clustering algorithm

document

overview

construct method:

fit method:

plot method:

example:

NOTE

reference

cluster result

About

Releases

Packages

Languages

colinwke/dpca

Folders and files

Latest commit

History

Repository files navigation

density peak clustering algorithm

document

overview

construct method:

fit method:

plot method:

example:

NOTE

reference

cluster result

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages