კლასტერული ანალიზის გამოყენება Microsoft Excel- ში

Pin
Send
Share
Send

ეკონომიკური პრობლემების გადაჭრის ერთ-ერთი ინსტრუმენტი კლასტერული ანალიზია. მისი დახმარებით, ჯგუფები და მონაცემთა მასივის სხვა ობიექტები კლასიფიცირდება ჯგუფებად. ამ ტექნიკის გამოყენება შესაძლებელია Excel- ში. ვნახოთ, როგორ ხდება ეს პრაქტიკაში.

კასეტური ანალიზის გამოყენებით

კასეტური ანალიზის დახმარებით შესაძლებელია სინჯების ჩატარება შესწავლილი ატრიბუტის შესაბამისად. მისი მთავარი ამოცანაა მრავალგანზომილებიანი მასივის ჰომოგენურ ჯგუფებად დაყოფა. როგორც ჯგუფების კრიტერიუმი, გამოიყენება წყვილი კორელაციის კოეფიციენტი ან ევკლიდური მანძილი მოცემულ პარამეტრთან ობიექტებს შორის. ერთმანეთთან უახლოესი მნიშვნელობები ჯგუფდება.

მიუხედავად იმისა, რომ ამ ტიპის ანალიზს ყველაზე ხშირად იყენებენ ეკონომიკაში, ის შეიძლება გამოყენებულ იქნას ბიოლოგიაში (ცხოველების კლასიფიკაცია), ფსიქოლოგიაში, მედიცინაში და ადამიანის საქმიანობის ბევრ სხვა სფეროში. კლასტერების ანალიზი შეიძლება გამოყენებული იქნას ამ მიზნებისათვის სტანდარტული Excel ინსტრუმენტარიუმის გამოყენებით.

გამოყენების მაგალითი

ჩვენ გვაქვს ხუთი ობიექტი, რომლებიც ხასიათდება ორი შესწავლილი პარამეტრით - x და .

  1. ჩვენ ვრცელდება ევკლიდური მანძილის ფორმულა ამ მნიშვნელობებზე, რომელიც გამოითვლება შაბლონის მიხედვით:

    = ROOT ((x2-x1) ^ 2 + (y2-y1) ^ 2)

  2. ეს მნიშვნელობა გამოითვლება ხუთივე ობიექტიდან თითოეულს შორის. გაანგარიშების შედეგები მოთავსებულია მანძილის მატრიცაში.
  3. ჩვენ ვხედავთ, თუ რომელი მნიშვნელობებს აფასებს მანძილი ყველაზე ნაკლებად. ჩვენს მაგალითში, ეს არის ობიექტები 1 და 2. მათ შორის მანძილი არის 4.123106, რაც ამ მოსახლეობის სხვა ელემენტებს შორის ნაკლებია.
  4. შეუთავსეთ ეს მონაცემები ჯგუფში და შექმენით ახალი მატრიცა, რომელშიც მოცემულია მნიშვნელობები 1,2 იმოქმედოს როგორც ცალკეული ელემენტი. მატრიცის შედგენისას წინა მაგიდიდან ყველაზე პატარა მნიშვნელობებს ვტოვებთ კომბინირებულ ელემენტს. ისევ ჩვენ ვხედავთ, რომელ ელემენტებს შორის მანძილია მინიმალური. ეს დრო არის 4 და 5ისევე როგორც ობიექტი 5 და საგნების ჯგუფი 1,2. მანძილი 6,708204.
  5. ჩვენ დავამატებთ მითითებულ ელემენტებს ზოგადი კლასტერში. ჩვენ ვაყალიბებთ ახალ მატრიქსს იმავე პრინციპის შესაბამისად, როგორც წინა დროს. ანუ ჩვენ ვეძებთ ყველაზე მცირე მნიშვნელობებს. ამრიგად, ჩვენ ვხედავთ, რომ ჩვენი მონაცემების ნაკრები შეიძლება დავყოთ ორ კლასებად. პირველი მტევანი შეიცავს ერთმანეთთან ყველაზე ახლოს მდებარე ელემენტებს - 1,2,4,5. ჩვენს შემთხვევაში მეორე კლასტერში მხოლოდ ერთი ელემენტია წარმოდგენილი - 3. იგი შედარებით შორს არის სხვა ობიექტებისაგან. მტევანს შორის მანძილი არის 9.84.

ეს ასრულებს მოსახლეობის ჯგუფებად დაყოფის წესს.

როგორც ხედავთ, მიუხედავად იმისა, რომ ზოგადად, კლასტერული ანალიზი შეიძლება რთულ პროცედურებად მოგვეჩვენოს, სინამდვილეში, ამ მეთოდის ნიუანსების გაგება არც ისე რთულია. მთავარია, რომ გავიგოთ დაჯგუფების ძირითადი ნიმუში.

Pin
Send
Share
Send