მონაცემთა მეცნიერების სასიცოცხლო ციკლი
მონაცემთა მეცნიერების სასიცოცხლო ციკლი მოიცავს შემდეგ ეტაპებს
- პრობლემის გაგება:ყველაფერი იწყება პრობლემის განსაზღვრით. შეკითხვების და პასუხების ძიება მონაცემთა სეტიდან
- მონაცემთა შეგროვება:როგორც ვხდებით მოცემული გულისხმობს მონაცემების შეკრებას. ამ ეტაპზეც ხდება პრობლემის განსაზღვრა და პასუხების ძიება
- მონაცემთა დამუშავება:მოცემული,სხვა ყველაფერთან ერთად გულისხმობს დანაკლისი მონაცემების განსაზღვრას და მათზე პასუხის მოძიებას. ასევე მონაცემთა ვიზუალიზაციას
- მონაცემთა შესწავლა: ვგულისხმობთ მონაცემთა ვიზუალიზაციას და სხვადასხვა სტატისტიკურ მიდგომებს,იმის დასადგენად გავეცითით თუ არა თავში დასმულ შეკითხვებს პასუხი. აქ მთავრდება მონაცემთა მეცნიერის საქმე
- ფუნქციების შერჩევა და დეველოპმენტი:ეს ეტაპი მოიცავს წინარე სამუშაოების ჩატარებას, სანამ გადავიდოდეთ მანქანური სწავლების და ღრმა დასწავლის მოდელების შემუშავებაზე
- მოდელიერება: ეს არის პროცესი რომელიც გულისხმობს მონაცემებიდან პასუხების მიღებას. ვაანალიზებთ რა ტენდენციებს რომლებიც მონაცემებს ახასიათებს,მათ შემდგომ ვიყენებთ პროგნოზირებისათვის.
- გაშვება:მას შემდეგ რაც ავაწყობთ მოდელს, ჩვენ უნდა გავუშვათ იგი, ისე რომ მივწვდეთ რელურ ადამიანებს. ვებ საიტებისა და მობილური აპლიკაციების დახმარებით
- მონიტორინგი: მოდელის გაშვების შემდეგ უნდა მოვახდინოთ მასზე დაკვირვება,ანალიზი და ოპტიმიზაცია