Меню сайта

Сутність методів багатомірної класифікації

фінансовий планування економетричний кластер

Кластерний аналіз - це метод багатомірного статистичного дослідження, до якого належать збір даних, що містять інформацію про вибіркові об'єкти, та упорядкування їх в порівняно однорідні, схожі між собою групи. Отже, сутність кластерного аналізу полягає у здійсненні класифікації об'єктів дослідження за допомогою численних обчислювальних процедур. В результаті цього утворюються "кластери" або групи дуже схожих об'єктів. На відміну від інших методів, цей вид аналізу дає можливість класифікувати об'єкти не за однією ознакою, а за декількома одночасно. Для цього вводяться відповідні показники, що характеризують певну міру близькості за всіма класифікаційними параметрами.

Мета кластерного аналізу полягає в пошуку наявних структур, що виражається в утворенні груп схожих між собою об'єктів - кластерів. Водночас його дія полягає й у привнесенні структури в досліджувані об'єкти. Це означає, що методи кластеризації необхідні для виявлення структури в даних, яку нелегко знайти при візуальному обстеженні або за допомогою експертів.

Основними завданнями кластерного аналізу є [23]:

розробка типології або класифікації досліджуваних об'єктів;

дослідження та визначення прийнятних концептуальних схем групування об'єктів;

висунення гіпотез на підставі результатів дослідження даних;

перевірка гіпотез чи справді типи (групи), які були виділені певним чином, мають місце в наявних даних.

Кластерний аналіз потребує здійснення таких послідовних кроків:

) проведення вибірки об'єктів для кластеризації;

) визначення множини ознак, за якими будуть оцінюватися відібрані об'єкти;

) оцінка міри подібності об'єктів;

) застосування кластерного аналізу для створення груп подібних об'єктів;

) перевірка достовірності результатів кластерного рішення.

Кожен з цих кроків відіграє значну роль у практичному здійснення Визначення множини ознак, які покладаються в основу оцінки об'єктів, у кластерному аналізі є одним із найважливіших завдань дослідження. Мета цього кроку повинна полягати у визначенні сукупності змінних ознак, яка найкраще відображає поняття подібності. Ці ознаки мають вибиратися з урахуванням теоретичних положень, покладених в основу класифікації, а також мети дослідження.

При визначенні міри подібності об'єктів кластерного аналізу використовуються чотири види коефіцієнтів: коефіцієнти кореляції, показники віддалей, коефіцієнти асоціативності та ймовірносні, коефіцієнти подібності. Кожен з цих показників має свої переваги та недоліки, які попередньо потрібно врахувати. На практиці найбільшого розповсюдження у сфері соціальних та економічних наук здобули коефіцієнти кореляції та віддалей.

В результаті аналізу сукупності вхідних даних створюються однорідні групи у такий спосіб, що об'єкти всередині цих груп подібні між собою за деяким критерієм, а об'єкти з різних груп відрізняються один від одного.

Кластеризація може здійснюватися двома основними способами, зокрема за допомогою ієрархічних чи ітераційних процедур.

Ієрархічні процедури - послідовні дії щодо формування кластерів різного рангу, підпорядкованих між собою за чітко встановленою ієрархією. Найчастіше ієрархічні процедури здійснюються шляхом агломеративних (об'єднувальних) дій. Вони передбачають такі операції [25]:

послідовне об'єднання подібних об'єктів з утворенням матриці подібності об'єктів;

побудова дендрограми (деревоподібної діаграми), яка відображає послідовне об'єднання об'єктів у кластери;

формування із досліджуваної сукупності окремих кластерів на першому початковому етапі аналізу та об'єднання всіх об'єктів в одну велику групу на завершальному етапі аналізу.

Ітераційні процедури полягають в утворенні з первинних даних однорівневих (одного рангу) ієрархічно не підпорядкованих між собою кластерів.

Найбільш відомими та широко застосовуваними методами формування кластерів є:

одиничного зв'язку;

повного зв'язку;

середнього зв'язку;

метод Уорда.

Метод одиничного зв'язку (метод близького сусіда) передбачає приєднання одиниці сукупності до кластера, якщо вона близька (знаходиться на одному рівні схожості) хоча б до одного представника цього кластера.

Метод повного зв'язку (далекого сусіда) вимагає певного рівня подібності об'єкта (не менше граничного рівня), що передбачається включити у кластер, з будь-яким іншим.

Перейти на сторінку: 1 2 3 4

Читайте більше

Проблеми та перспективи розвитку кредитних спілок в Україні
Актуальність теми. Принципово новим в Україні в умовах трансформації економіки є створення поряд з банками небанківських фінансово-кредитних інститутів. Закордонний досвід свідчить про те, що небанківські фінансово-кредитні інститути відіграють дуже важливу роль в економічному розвитку к ...

Податкова політика України
Проведення ринкових реформ значною мірою залежить від стану фінансів держави та її бюджету, через який держава акумулює кошти для фінансування пріоритетних напрямів розвитку економіки, соціальної сфери, культури тощо. Бюджетні відносини потребують державного регулювання, яке досягаєть ...