Меню сайта

Сутність методів багатомірної класифікації

1 - значення l-ї ознаки у i-го об’єкта, l=; i,j=;

- вектор-стовпець значень всіх ознак на i-му об’єкті;

W-1 - матриця, обернена до коваріаційної;

- загальна кількість значень властивостей, що співпадають, (нулевих та одиничних, де 1 - наявність властивостей, 0 - відсутність);

- кількість співпадаючих одиничних властивостей;

- кількість одиничних значень властивостей;

; де - значення порога для l-го признака;

= - мера близькості об’єктів по l-му признаку;

- інформаційна вага признака, розрахована певних чином.

Етап 2. Використання того або іншого методу кластерного аналізу в залежності від цілей дослідження. Одним із найбільш поширених способів проведення ітераційних процедур ось уже понад сорок років виступає метод k-середніх. Застосування його потребує здійснення таких кроків:

розділення вихідних даних досліджуваної сукупності на задану кількість кластерів;

обчислення багатовимірних середніх (центрів тяжіння) виділених кластерів;

розрахунок Евклідової відстані кожної одиниці сукупності до визначених центрів тяжіння кластерів та побудова матриці відстаней, яка ґрунтується на метриці відстаней. Використовують різні метрики відстаней, наприклад: Евклідова відстань (проста і зважена), Манхеттенська, Чебишева, Мінковського, Махалонобіса тощо;

– визначення нових центів тяжіння та нових кластерів.

Вибір даного методу кластеризації обґрунтований наступними перевагами:

даний метод не будує геометричні кластери, що дозволяє уникнути їхнього перетинання і, як наслідок, влучення одного й того самого елемента в кілька кластерів;

дозволяє формувати задану кількість кластерів, що полегшує економічну інтерпретацію отриманих результатів.

Використання методу k-середніх ґрунтується на двох критеріях:

Мінімізація відстані всередині кластера між його елементами. Цей критерій забезпечує формування кластерів з тісно лежачих один до одного об'єктів.

Максимізація відстані між центрами кластерів. Використання даного критерію дозволяє виділити кластери, що знаходяться на максимально можливій відстані друг від друга

Дискримінантний аналіз. Існують такі основні методи багатомірної класифікації з навчанням як дискримінантний аналіз. Дискримінантний аналіз є розділом багатовимірного статистичного аналізу, який дозволяє вивчати відмінності між двома і більш групами об'єктів по декількох змінних одночасно. Дискримінантний аналіз - це загальний термін, що відноситься до декількох тісно зв'язаних статистичних процедур. Ці процедури можна розділити на методи інтерпретації міжгрупових відмінностей - дискримінації і методи класифікації спостережень по групах. При інтерпретації потрібно відповісти на питання: чи можливо, використовуючи даний набір змінних, відрізнити одну групу від іншої, наскільки добре ці змінні допомагають провести дискримінацію і які з них найбільш інформативні?

Методи класифікації пов'язані з отриманням однієї або декількох функцій, що забезпечують можливість віднесення даного об'єкту до однієї з груп. Ці функції називаються класифікуючими і залежать від значень змінних таким чином, що з'являється можливість віднести кожний об'єкт до однієї з груп.

Задачі дискримінантного аналізу можна розділити на три типи. Задачі першого типу часто зустрічаються в медичній практиці. Припустимо, що ми маємо свій в розпорядженні інформацію про деяке число індивідуумів, хвороба кожного з яких відноситься до одного з двох або більш діагнозів. На основі цієї інформації потрібно знайти функцію, що дозволяє поставити у відповідність новим індивідуумам характерні для них діагнози. Побудова такої функції і складає задачу дискримінації.

Перейти на сторінку: 1 2 3 4

Читайте більше

Фактори, що впливають на рівень фінансової стійкості підприємства
На фінансову стійкість підприємства впливає ціла низка чинників. З метою управління окремими з них, посилення чи послаблення їх впливу на фінансову стійкість підприємства їх можна об’єднати в групи залежно від рівня виникнення та ступеня значущості (рис. 1.1) [14]. Рисунок 1.1 - Види ф ...

Моделювання фінансових потоків підприємства ЗАТ ТЕТЗ-Інвест
Будь-який вид підприємницької діяльності чітко орієнтований на одержання прибутку, але будь-який вид діяльності не виключає ризику збитків і банкрутств. Забезпечення стабільності і ефективності функціонування підприємств України в мінливих ринкових умовах в першу чергу залежить від якості ...