Меню сайта

Сутність методів багатомірної класифікації

1 - значення l-ї ознаки у i-го об’єкта, l=; i,j=;

- вектор-стовпець значень всіх ознак на i-му об’єкті;

W-1 - матриця, обернена до коваріаційної;

- загальна кількість значень властивостей, що співпадають, (нулевих та одиничних, де 1 - наявність властивостей, 0 - відсутність);

- кількість співпадаючих одиничних властивостей;

- кількість одиничних значень властивостей;

; де - значення порога для l-го признака;

= - мера близькості об’єктів по l-му признаку;

- інформаційна вага признака, розрахована певних чином.

Етап 2. Використання того або іншого методу кластерного аналізу в залежності від цілей дослідження. Одним із найбільш поширених способів проведення ітераційних процедур ось уже понад сорок років виступає метод k-середніх. Застосування його потребує здійснення таких кроків:

розділення вихідних даних досліджуваної сукупності на задану кількість кластерів;

обчислення багатовимірних середніх (центрів тяжіння) виділених кластерів;

розрахунок Евклідової відстані кожної одиниці сукупності до визначених центрів тяжіння кластерів та побудова матриці відстаней, яка ґрунтується на метриці відстаней. Використовують різні метрики відстаней, наприклад: Евклідова відстань (проста і зважена), Манхеттенська, Чебишева, Мінковського, Махалонобіса тощо;

– визначення нових центів тяжіння та нових кластерів.

Вибір даного методу кластеризації обґрунтований наступними перевагами:

даний метод не будує геометричні кластери, що дозволяє уникнути їхнього перетинання і, як наслідок, влучення одного й того самого елемента в кілька кластерів;

дозволяє формувати задану кількість кластерів, що полегшує економічну інтерпретацію отриманих результатів.

Використання методу k-середніх ґрунтується на двох критеріях:

Мінімізація відстані всередині кластера між його елементами. Цей критерій забезпечує формування кластерів з тісно лежачих один до одного об'єктів.

Максимізація відстані між центрами кластерів. Використання даного критерію дозволяє виділити кластери, що знаходяться на максимально можливій відстані друг від друга

Дискримінантний аналіз. Існують такі основні методи багатомірної класифікації з навчанням як дискримінантний аналіз. Дискримінантний аналіз є розділом багатовимірного статистичного аналізу, який дозволяє вивчати відмінності між двома і більш групами об'єктів по декількох змінних одночасно. Дискримінантний аналіз - це загальний термін, що відноситься до декількох тісно зв'язаних статистичних процедур. Ці процедури можна розділити на методи інтерпретації міжгрупових відмінностей - дискримінації і методи класифікації спостережень по групах. При інтерпретації потрібно відповісти на питання: чи можливо, використовуючи даний набір змінних, відрізнити одну групу від іншої, наскільки добре ці змінні допомагають провести дискримінацію і які з них найбільш інформативні?

Методи класифікації пов'язані з отриманням однієї або декількох функцій, що забезпечують можливість віднесення даного об'єкту до однієї з груп. Ці функції називаються класифікуючими і залежать від значень змінних таким чином, що з'являється можливість віднести кожний об'єкт до однієї з груп.

Задачі дискримінантного аналізу можна розділити на три типи. Задачі першого типу часто зустрічаються в медичній практиці. Припустимо, що ми маємо свій в розпорядженні інформацію про деяке число індивідуумів, хвороба кожного з яких відноситься до одного з двох або більш діагнозів. На основі цієї інформації потрібно знайти функцію, що дозволяє поставити у відповідність новим індивідуумам характерні для них діагнози. Побудова такої функції і складає задачу дискримінації.

Перейти на сторінку: 1 2 3 4

Читайте більше

Формування та використання засобів Пенсійного фонду (На прикладі ЗАТ Зіньківський комбікормовий завод Полтавської області Зіньківського району)
В Україні, як і в усьому світі, тривають процеси старіння населення. Тим часом вік виходу на пенсію у нас один із найнижчих порівняно з іншими країнами. За таких умов уже в 2025 році один працюючий буде утримувати одного пенсіонера, що призведе до різкого зростання дефіциту бюджету Пенсі ...

Облік фінансових результатів підприємства та оцінка інвестиційної привабливості підприємств агропромислового комплексу (на матеріалах Агрофірми Маяк)
облік фінансовий оздоровлення Функціонування України як незалежної самостійної держави стало початком бурхливих змін у соціально-економічному житті країни. У цих умовах перебудову господарської діяльності підприємств спрямовано на оволодіння механізмом ринкових відносин і поставлено н ...