Verilənlərin mədənçiliyi

Verilənlərin hasilatı, data mədənçiliyi və ya verilənlərin mədənçiliyimaşın öyrənməsi, statistikaverilənlər bazası sistemlərinin kəsişməsindəki metodları əhatə edən böyük məlumat dəstlərində nümunələrin çıxarılması və aşkarlanması prosesi.[1] Verilənlərin hasilatı, məlumat toplusundan məlumatı (ağıllı üsullarla) çıxarmaq və məlumatları daha sonra istifadə üçün başa düşülən struktura çevirmək məqsədi daşıyan kompüter elmləri və statistikanın fənlərarası alt sahəsidir.[1][2][3][4] Verilənlərin hasilatı "verilənlər bazasında bilik kəşfi" (KDD) prosesinin təhlil mərhələsidir.[5] Xam təhlil mərhələsindən başqa, o, həmçinin verilənlər bazası və məlumatların idarə edilməsi aspektlərini, verilənlərin əvvəlcədən işlənməsini, model və nəticə çıxarma mülahizələrini, maraqlılıq ölçülərini, mürəkkəblik mülahizələrini, aşkar edilmiş strukturların sonrakı emalını, vizuallaşdırmanı və onlayn yeniləməni əhatə edir.[1]

"Data mining" səhv addır, çünki məqsəd məlumatların özünün çıxarılması (hasilatı) deyil, böyük həcmdə məlumatlardan nümunələrin və biliklərin çıxarılmasıdır.[6] O, həm də məşhur sözdür[7] və genişmiqyaslı məlumatların və ya informasiya emalının istənilən formasına, eləcə də süni intellekt və biznes intellekti daxil olmaqla, qərar qəbuledici dəstək sisteminin hər hansı tətbiqinə tez-tez tətbiq olunur. Adətən daha ümumi terminlər, verilənlərin təhlili və analitikası və ya faktiki metodlara istinad etmək ya da süni intellekt və maşın öyrənməsi daha uyğundur.

Faktiki verilənlərin hasilatı tapşırığı, məlumat qeydləri qrupları, qeyri-adi qeydlər və asılılıqlar kimi əvvəllər naməlum, maraqlı nümunələri çıxartmaq üçün böyük miqdarda məlumatın yarı avtomatik və ya avtomatik təhlilidir. Bu, adətən fəza indeksləri kimi verilənlər bazası üsullarından istifadəni nəzərdə tutur. Bu nümunələr daha sonra daxil edilən məlumatların bir növ xülasəsi kimi görünə bilər və sonrakı təhlillərdə və ya maşın öyrənməsində və proqnozlaşdırıcı analitikada istifadə edilə bilər. Məsələn, verilənlərin öyrənilməsi mərhələsi verilənlərdə çoxlu qrupları müəyyən edə bilər, daha sonra qərar qəbuledici dəstək sistemi tərəfindən daha dəqiq proqnoz nəticələri əldə etmək üçün istifadə edilə bilər. Nə məlumatların toplanması, hazırlanması, nə də nəticələrin izahı və hesabatı əlavə mərhələlər kimi ümumi KDD prosesinə aid olsa da, məlumatların çıxardılması mərhələsinin bir hissəsi deyil.

Verilənlərin təhlili ilə hasilatı arasındakı fərq ondan ibarətdir ki, təhlil verilənlər bazasında modelləri və fərziyyələri yoxlamaq üçün istifadə olunur, məsələn, məlumatların miqdarından asılı olmayaraq marketinq kampaniyasının effektivliyini təhlil etmək. Hasilat isə əksinə olaraq böyük həcmdə məlumatda gizli nümunələri aşkar etmək üçün maşın öyrənməsi və statistik modellərdən istifadə edir.[8]

"Məlumatların dərinləşdirilməsi", "məlumatların ovlanması" və "məlumatların izlənilməsi" terminləri aşkar edilmiş hər hansı nümunələrin etibarlılığı ilə bağlı etibarlı statistik nəticələr çıxarmaq üçün çox kiçik olan (və ya ola bilən) daha böyük toplunun hissələrinin nümunə götürülməsi üçün məlumatların çıxarılması metodlarının istifadəsinə aiddir. Bununla belə, bu üsullar daha böyük məlumat toplusuna qarşı test etmək üçün yeni fərziyyələrin yaradılmasında istifadə edilə bilər.

  1. 1 2 3 "Data Mining Curriculum". ACM SIGKDD. 2006-04-30. 2013-10-14 tarixində arxivləşdirilib. İstifadə tarixi: 2014-01-27.
  2. Clifton, Christopher. "Encyclopædia Britannica: Definition of Data Mining". 2010. 2011-02-05 tarixində arxivləşdirilib. İstifadə tarixi: 2010-12-09.
  3. Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome. "The Elements of Statistical Learning: Data Mining, Inference, and Prediction". 2009. 2009-11-10 tarixində orijinalından arxivləşdirilib. İstifadə tarixi: 2012-08-07.
  4. Han, Jaiwei; Kamber, Micheline; Pei, Jian. Data Mining: Concepts and Techniques (3rd). Morgan Kaufmann. 2011. ISBN 978-0-12-381479-1.
  5. Fayyad, Usama; Piatetsky-Shapiro, Gregory; Smyth, Padhraic. "From Data Mining to Knowledge Discovery in Databases" (PDF). 1996. 2022-10-09 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 17 December 2008.
  6. Han, Jiawei; Kamber, Micheline. Data mining: concepts and techniques. Morgan Kaufmann. 2001. səh. 5. ISBN 978-1-55860-489-6. Thus, data mining should have been more appropriately named "knowledge mining from data," which is unfortunately somewhat long
  7. OKAIRP 2005 Fall Conference, Arizona State University Arxivləşdirilib 2014-02-01 at the Wayback Machine
  8. Olson, David L. "Data mining in business services". Service Business. 1 (3). 12 iyul 2007: 181–193. doi:10.1007/s11628-006-0014-7.

Xarici keçidlər

[redaktə | mənbəni redaktə et]