Data analitikasında əsas terminlər
  • Nigar Qurbanli
  • 6 İyun 2019

Data analitikasında əsas terminlər

Data terminləri

Data mining

Böyük həcmli verilənlərin içərisindən faydalı və yeni informasiyanın tapılmasından bəhs edir. Data mining bir çox süni intellekt, statistikada istifadə olunan metodlarla üst-üstə düşür. Data Mining'in cəlb olunduğu işlər: anomaliyanın aşkarlanması; fərqli verilənin tapılması. Digər verilənlərdən fərqlidirsə, bu ya səhv ola bilər, ya da bu verilənin araşdırılmasına ehtiyac var, assosiasiya qaydaların öyrənilməsi (association rule learning): Verilənlər arasında əlaqənin tapılması, Clustering: Oxşar verilənlərin mərkəzlərə görə bölünməsi, Sinifləşdirmə (classification): Verilənlərin siniflərə görə bölünməsi, Alt çoxluğun tapılması (Subgroup discovery).

Data Warehouse

Verilənlər bazasıdır və əməliyyat proseslərinin sorgusu və analizi üçün dizayn olunmuşdur. Keçmişə yönəlik bilgilər əməliyyat proseslerinin tutulduğu verilənlər bazasindan və başqa mənbələrdən (fayl , veb servis ve s.) alinarak data warehouse -a toplanir. Bundan əlavə olaraq Data Warehouse mühitinə verilənlərin alinması, çevrilməsi, yüklənməsi, statistik analiz, reporting, verilənlərin intelektual analizi və başqa bu kimi özəlliklər daxildir.

Big data nədir?

Big data ənənəvi yollarla toplanmış və rəqəmsal mənbələrdən əldə edilmiş, şirkətdaxili və şirkətdənkənar məlumatların struktursuz və multistrukturlu (bir neçə struktur formatında) şəklinə deyilir hansı ki, istənilən sektorda ölçüləbilən qərarvermə mexanizmində geniş istifadə olunur. Big data haqqında öyrənmək üçün ilk əvvəl datanın struktursuz və multistrukturlu olmasını müəyyən etmək lazımdır. Struktursuz data- ənənəvi data tətbiqləri ilə asanlıqla analiz olunan, modelləşdirilə bilən, əsasən tekst ağırlıqlı dataya deyilir. Metadata, Twitter tweetləri və digər sosial media postları struktursuz dataya nümunədir. Multistrukturlu data- Bir neçə data formatının istifadə olunduğu multistrukturlu data, insanlarla süni zəkanın birgə ortaya çıxardığı işdir. Multistrukturlu data həm tekstlərdən, həm şəkillərdən təşkil oluna bilər.

Data Science

Günümüzdə texnologiyanın inkişafı nəticəsində məlumatlar inanılmaz dərəcədə artır. Araşdırmalar nəticəsində 2020-ci ilə qədər bir saniyəyə hər insan 1.7 megabyte məlumat istehsal etmiş olacaq. Bu isə ümumilikdə 8 zetabaytlıq məlumat deməkdir. Bu qədər məlumatın olması informasiya elminə zərurəti getdikcə artırır. “Data Science” çox önəmli sahə olub məlumatların toplanmasına, onların müxtəlif statistik və riyazi analiz proqramları ilə analiz olunaraq nəticələrin əldə edilməsinə, bu nəticələr ilə önəmli qərarların verilməsinə xidmət edir. “Data Science” 3 əsas elmdən ibarətdir – Riyaziyyat, Statistika və İnformasiya və Texnologiya.


Paylaş: