ვინ არიან მონაცემთა მეცნიერები
“მას შემდეგ, რაც ტექნოლოგია ადამიანის ყოველდღიურობის განუყოფელი ნაწილი გახდა, ყველამ დავიწყეთ ძალიან დიდი ოდენობით მონაცემების შექმნა. ეს მონაცემები იქნება მაშინ, როცა ონლაინ მაღაზიაში ვათვალიერებთ ან ვყიდულობთ პროდუქტს, ვუყურებთ ვიდეოს ან ვწერთ პოსტს სოციალურ ქსელში”, — ამბობს საქართველოს ბანკის მონაცემთა მეცნიერი, გიგია აფციაური.
და მართლაც, დიდი მოცულობის მონაცემები სულ უფრო სწრაფად იქმნება და მათ წარმოებაში წვლილი თითოეულ ჩვენგანს მიგვიძღვის. ხოლო მზარდი მონაცემების კვალდაკვალ, სულ უფრო ჩნდება მათი ანალიზისა და ინტერპრეტირების საჭიროება. შესაბამისად, პროფესიათა შორის ვხედავთ შედარებით ახალ და ბევრისთვის უცნობ — მონაცემთა მეცნიერის პროფესიას.
ვინ არიან მონაცემთა მეცნიერები
“მონაცემთა მეცნიერები ვართ ის ხალხი, ვინც ამ უკიდეგანოდ დიდი მონაცემებიდან (BIG DATA-დან) ვქმნით პროდუქტებს, რომლებიც მომხმარებლებს უმარტივებს ცხოვრებას. მონაცემთა მეცნიერებას უდიდესი მნიშვნელობა აქვს, მიუხედავად იმისა, რომ ეს ცალსახად აშკარა არაა. ყოველ დილით მონაცემთა მეცნიერის მიერ შექმნილი მოდელი გვიგდებს news feed-ს, ასევე მონაცემთა მეცნიერის მიერ შექმნილი suggestion-მოგვდის თუნდაც ამაზონიდან. მოკლედ რომ ვთქვათ, მონაცემთა მეცნიერები ქმნიან პროდუქტებს, რომლებსაც მომხმარებლის სურვილები მათსავით კარგად ესმით. რა თქმა უნდა, ეს ჩვენი ყოველდღიურობის ისევე, როგორც ტექნოლოგიური განვითარების ქვაკუთხედია”, — გვიყვება გიგია აფციაური.
მონაცემთა მეცნიერები არიან პასუხისმგებელნი, მონაცემთა დიდი მასებიდან გამოყონ გამოსადეგი ინფორმაცია და შექმნან ალგორითმები, რომლებიც დახმარება კომპანიებს და ორგანიზაციებს ოპტიმალური ოპერაციების განხორციელებაში.
საქართველოს ბანკის კიდევ ერთი მონაცემთა მეცნიერი — ნიკოლოზ მამისაშვილი კი ამბობს, რომ დღესდღეობით ნებისმიერ ეკონომიკურ საქმიანობას თან ახლავს მონაცემთა დაგროვება, ხოლო სწრაფად მზარდი მონაცემების შენახვა ბიზნესისთვის მნიშვნელოვან ინფრასტრუქტურულ ხარჯებთან არის დაკავშირებული:
“დაგროვებული მონაცემების გამოყენების გარეშე ასეთი დანახარჯების გაწევა კომერციული ორგანიზაციისთვის ირაციონალური იქნებოდა. მონაცემთა ანალიზი კომპანიებს ამ პრობლემის მოგვარებაში ეხმარება. მისი საშუალებით შესაძლებელია ნედლი სახით წარმოდგენილი მონაცემების ბიზნესისთვის ღირებულ ინფორმაციად გარდაქმნა”.
მონაცემთა მეცნიერება, როგორც აუცილებლობა ბიზნესისთვის
თანამედროვე სამყაროში, მონაცემთა მეცნიერების საჭიროებას სულ უფრო თვალნათლივ ვხედავთ, პირველ რიგში კი ამას ბიზნესის წარმომადგენლები გრძნობენ. ეს სფერო მნიშვნელოვანი ხდება ნებისმიერი ზომის კომპანიისთვის. როგორც გიგია აფციაური ამბობს, მონაცემთა მეცნიერებამ და მასზე ხელმისაწვდომობამ და ინტერპრეტაციამ, შეცვალა ძველი ინდუსტრიის ბიზნეს მოდელები და წარმოქმნა თანამედროვე და ახალი ბიზნეს მოდელები. თუმცა ეს ყველაფერი არ არის:
“მონაცემთა მეცნიერება თითქმის ყველა ტიპის ბიზნესისთვის ძალიან დიდი Boost-ია. შესაძლებელია კომპანია არ ქმნიდეს/ინახავდეს data-ს, მაგრამ მოახდინოს სხვა წყაროების უტილიზირება ისე რომ გაზარდოს მომხმარებლის/შემოსავლის რაოდენობა. წამყვანი კომპანიები (მაგალითად საქართველოს ბანკი), ამას დიდი ხანია მიხვდა ამიტომაც აქტიურ რეჟიმში მიდის რესურსების მონაცემთა მეცნიერებისკენ მიმართვა, რაც კომპანიას გაზრდაში და გაძლიერებაში ეხმარება. იმედი მაქვს სხვა კომპანიებიც გამოიჩენენ ინტერესს და დაინახავენ პოტენციალს ამ სფეროში”, — ამბობს გიგია აფციაური.
მონაცემთა მეცნიერების გამოწვევები საქართველოში
ნიკოლოზ მამისაშვილი გვიყვება, რომ საქართველოში ამ სფეროში კადრობრივი დეფიციტი შეიმჩნევა. მისი კარიერის დასაწყისში მონაცემთა მეცნიერების საზოგადოება საკმაოდ მოკრძალებულად იყო წარმოჩენილი, თუმცა, ეს მოცემულობა ნელ-ნელა იცვლება.
“მახსოვს, ზოგიერთ კომპანიაში პოზიციის ასეთი დასახელება ღიმილის მომგვრელიც კი იყო. დღეს სურათი მნიშვნელოვნად არის შეცვლილი: კომპანიებმა აქტიურად დაიწყეს პროფესიონალი მონაცემთა მეცნიერების ძიება. ამის საპასუხოდ, საგანმანათლებლო სექტორში უკვე გამოჩნდნენ ისეთ უნივერსიტეტები და ცენტრები, რომლებიც ამ პროფესიის უნარების ჩამოყალიბებას უწყობენ ხელს. მიუხედავად იმისა, რომ ასეთი კურსების გავლის შემდეგ, ჩემი შეფასებით, ახალგაზრდები მზად არიან მონაცემთა მეცნიერად მუშაობისთვის, მათ არ გააჩნიათ საკმარისი სამუშაო გამოცდილება და იმისათვის, რომ ბიზნესის მოთხოვნები დააკმაყოფილონ, გარკვეული დროა საჭირო”, — გვიყვება ნიკოლოზ მამისაშვილი.
ნიკოლოზმა დაასახელა სფეროში მოღვაწე სამი ტიპის პროფესიონალი, რომელსაც ბიზნესის მოთხოვნებთან შესაბამისად გარკვეული პრობლემები აქვს. პირველი ასეთი დარგის მცოდნე პროფესიონალია, რომელსაც მათემატიკური უნარები აქვს. ის ტრადიციული, გამოცდილი ტექნიკებით წარმატებით ჭრის ბიზნეს ამოცანებს და ხელშესახები შედეგებიც მოტანაც შეუძლია. თუმცა, ამ ჯგუფის გამოწვევა ცვალებადი ტექნოლოგიებისთვის ფეხის აწყობაა, რაც ამ პროფესიისთვის საკმაოდ მნიშვნელოვანია. მეორე კატეგორია ნიკოლოზისთვის კომპიუტერული უნარებით შეიარაღებული პროფესიონალები არიან, რომლებიც მონაცემთა მეცნიერებას კომპიუტერული მეცნიერების სფეროს ნაწილად განიხილავენ. “ეს ჯგუფი მოწინავე ტექნოლოგიებს იყენებს და საკმაოდ პროგრესულად მოაზროვნე ახალგაზრდებს წარმოადგენს. მათი მთავარი გამოწვევა დარგის ცოდნაა, რაც მონაცემთა მეცნიერისთვის აუცილებელ კომპონენტია”, — ამბობს ნიკოლოზი.
ხოლო მესამე კატეგორია, რომელსაც ნიკოლოზ მამისაშვილი ჩვენთან საუბრისას გამოყოფს დაბალანსებული და გამოცდილი მონაცემთა მეცნიერებია. ეს არიან ადამიანები, რომლებმაც კარიერის ადრეულ ეტაპზე აირჩიეს ეს პროფესია. ისინი საკმარისი ხარისხით პასუხობენ ბიზნესის მოთხოვნებს. “საქმე ის არის, რომ ამ ჯგუფს ახასიათებს თავისი თავის საერთაშორისო ბაზარზე პოზიციონირება ფრილანსინგის, ან სტარტაპ კომპანიების სახით, რაც განაპირობებს იმას, რომ ქართული კომპანიებს უჭირთ საერთაშორისო შრომის ბაზრის კონკურენციასთან გამკლავება. ვფიქრობ ამ ნაკლის ამოვსება დროის საკითხია და ახალგაზრდა თაობის გამოცდილების დაგროვებით, საშუალოვადიან პერიოდში შესაძლებელია”, — ამბობს ნიკოლოზი.
რაში იყენებენ მონაცემთა მეცნიერებას საქართველოში
მიუხედავად იმისა, რომ ეს სფერო საქართველოში საკმაოდ ახალია, ამ მიმართულებით არაერთი მნიშვნელოვანი პროექტი უკვე განხორციელებულია. როგორც ზემოთაც აღვნიშნეთ, ისეთი დიდი კომპანიები, როგორიც საქართველოს ბანკია, საკმაოდ სწრაფად რეაგირებენ გლობალური ბაზრის ცვლილებებზე და სხვადასხვა სიახლის დანერგვას კომპანიაში სწრაფადვე ახერხებენ. ნიკოლოზ მამისაშვილი კი მოგვიყვა იმ პროექტებზე, რომლებზეც ამ ეტაპზე მუშაობენ. ერთ-ერთი მათგანია ქართული ენის მანქანური მოდელი.
“ტექსტური მონაცემების ზომა, სოციალური ქსელების პოპულარულობასთან ერთად, განსაკუთრებული ზრდით ხასიათდება. ადამიანისთვის ადვილად გასაგები ტექსტის ანალიზი კომპიუტერისთვის საკმაოდ რთულ ამოცანას წარმოდგენს. მოწინავე ტექნოლოგიები საშუალებას გვაძლევს, ეს ამოცანა ეფექტურად გადავწყვიტოთ, თუმცა, ჩვენი დაკვირვებით, ქართული ენა ჯერაც ტექნოლოგიური გიგანტების ყურადღების მიღმა რჩება. ამიტომ, ჩვენი გუნდი ცდილობს საფუძველი ჩაუყაროს ქართული ენისთვის ისეთი მანქანური მოდელის შემუშავებას, რომელიც არა მხოლოდ საქართველოს ბანკისთვის, არამედ მთლიანად ქართული საზოგადოებისთვის მნიშვნელოვან მონაპოვარს წარმოადგენს”, — გვიყვება ნიკოლოზი.
აღნიშნული პროექტის განსახორციელებლად გუნდი დიდი მოცულობის მონაცემებს იყენებს, რითაც მოხდება მოდელის გაწვრთნა და ის დროთა განმავლობაში სულ უფრო დაიხვეწება. ამ კონკრეტული პროექტის შემთხვევაში მონაცემებს ქართული ტექსტები წარმოადგენს. მონაცემთა მეცნიერის დანიშნულება კი მათი სწორად შერჩევა და კატეგორიზებაა, იმისათვის, რომ მოდელმა სწორ მონაცემებზე დაყრდნობით ისწავლოს, შესაბამისად კი, მისი სიზუსტე/აკურატულობა მაღალი იყოს.
მეორე მიმდინარე პროექტი, რომელზეც ნიკოლოზი გვესაუბრა სარეკომენდაციო სისტემის შექმნას გულისხმობს.
“ამჟამინდელი ეკონომიკური სისტემა ისეა მოწყობილი, რომ მომხმარებელს საკმაოდ შეზღუდული დრო აქვთ პროდუქტის შეძენისას არჩევანის გასაკეთებლად, მეორე მხრივ კი წარმოებული საქონლისა და მომსახურების მრავალფეროვნება დღითიდღე იზრდება. ეს წარმოქმნის არჩევანის დილემას, რომლის წინაშეც მომხმარებელი დგება. გამჭრიახი სარეკომენდაციო სისტემა არის ძრავი, რომელიც უზრუნველყოფს მრავალფეროვანი პროდუქტებისაგან მომხმარებელზე ორიენტირებული ინდივიდუალური შეთავაზების განსაზღვრის ავტომატიზაციას. საქართველოს ბანკში ვცდილობთ, მანქანური დასწავლის მოწინავე მეთოდების გამოყენებას, რაც ასეთი ტიპის სისტემის დახვეწილი გადაწყვეტის საშუალებას გვაძლევს”, — ამბობს ნიკოლოზ მამისაშვილი.
გარდა ამისა, საქართველოში წარმოდგენილი რამდენიმე კომპანია, განსაკუთრებით კი ისინი, რომლებიც ხელოვნური ინტელექტის მიმართულებით მოღვაწეობენ (PulsarAI, Systemcorp, MaxinAI), სწორედ რომ დიდი მოცულობის მონაცემებს იყენებენ თავიანთი მოდელების გასაწვრთნელად. მათი მონაცემთა მეცნიერები კი მუდმივად ქმნიან საშენ მასალას (მონაცემებს) ხელოვნური ინტელექტისთვის. ქართულ მონაცემთა მეცნიერების ბაზარს კი ისეთი საერთაშორისო დონის ღონისძიებები აჯანსაღებენ, როგორიცაა DataFest Tbilisi. ეს არის ყოველწლიური კონფერენცია, რომელიც მონაცემების კუთხით გამოცდილებების გაცვლასა და კომპეტენციების ზრდას ახალისებს.
მოთხოვნა მონაცემთა მეცნიერის პროფესიაზე და საფრთხეები
როგორც უკვე ვთქვით, ეს შედარებით ახალი პროფესია სულ უფრო აქტუალური ხდება. მონაცემთა მეცნიერება ჩვენი ყოველდღიურობის უხილავი ნაწილია, რომლის გამოყენებასაც სამყარო საკმაოდ სწრაფად ახერხებს სხვადასხვა პრობლემის გადასაჭრელად.
“დღესდღეობით, ნებისმიერი ორგანიზაციისთვის მნიშვნელოვანია მომხმარებელი და მისი გრძელვადიანი კმაყოფილების უზრუნველყოფა. ამიტომ ვფიქრობ, რომ მონაცემთა მეცნიერის პროფესიაზე მოთხოვნის მნიშვნელოვან კომპონენტს სწორედ გამჭრიახი სარეკომენდაციო სისტემების შემუშავება განაპირობებს”, — ამბობს ნიკოლოზ მამისაშვილი.
თუმცა, საგულისხმოა საფრთხეები, რომლებიც ამ მიმართულებით არსებობს. მონაცემთა მეცნიერებმა შესაძლოა საფუძველი დაუდონ ისეთი ალგორითმების შექმნას, რომლებიც მათ პირდაპირ ჩანაცვლებას გახდის შესაძლებელს. თუმცა, ნიკოლოზს მაინც ვკითხეთ, თუ მისი აზრით, რა მომავალი აქვს მის პროფესიას:
“ეს კითხვა საკმაოდ ხშირად ისმის სხვადასხვა სოციალურ ქსელში, მონაცემთა მეცნიერების საზოგადოებაში. ადამიანებს აინტერესებთ, თუ რას უნდა ელოდონ მონაცემთა მეცნიერის პროფესიისგან მოკლე, საშუალო და გრძელვადიან პერიოდში. ჩემი აზრით, ამის შეფასება ძალიან რთულია. რაც შემიძლია ვთქვა არის ის, რაც უკვე ვახსენეთ — მონაცემების ექსპონენციალური ზრდა მათი მეცნიერული მეთოდებით დამუშავების აქტუალურობას ზრდის. რაც შეეხება საფრთხეს, მონაცემთა მეცნიერებასაც იგივე საფრთხე უდგას, რაც სხვა პროფესიებს. ჩემი აზრით, კვანტური გამოთვლითი რესურსის გამოყენებისა და ხელოვნური ინტელექტის განვითარების საშუალებით, არ არის გამორიცხული მონაცემთა მეცნიერის საქმიანობის ავტომატიზაცია მნიშვნელოვანი დონით განხორციელდეს”.
თუმცა მანამ, სანამ ამ ახლადგაჩენილი პროფესიის ნაწილობრივი ავტომატიზაციის მომსწრენი გავხდებით, მონაცემთა მეცნიერები აქტუალურ პროფესიათა შორის თავის დამკვიდრებას ცდილობენ და ახერხებენ კიდეც. ეს ერთ-ერთი მოთხოვნადი პროფესიაა ტექნოლოგიურ ინდუსტრიაში, რომელსაც ერთმანეთზე საინტერესო ქვეპროფესიები აქვს, იქნება ეს მონაცემთა ანალიზისა თუ ვიზუალიზაციის მიმართულებები. ჩვენ კი მათ შესახებ, უფრო დაწვრილებით, სხვა სტატიებშიც ვისაუბრებთ.