Verilənlərin mədənçiliyi

Verilənlərin hasilatı, data mədənçiliyi və ya verilənlərin mədənçiliyi — maşın öyrənməsi, statistika və verilənlər bazası sistemlərinin kəsişməsindəki metodları əhatə edən böyük məlumat dəstlərində nümunələrin çıxarılması və aşkarlanması prosesi.^[1] Verilənlərin hasilatı, məlumat toplusundan məlumatı (ağıllı üsullarla) çıxarmaq və məlumatları daha sonra istifadə üçün başa düşülən struktura çevirmək məqsədi daşıyan kompüter elmləri və statistikanın fənlərarası alt sahəsidir.^[1]^[2]^[3]^[4] Verilənlərin hasilatı "verilənlər bazasında bilik kəşfi" (KDD) prosesinin təhlil mərhələsidir.^[5] Xam təhlil mərhələsindən başqa, o, həmçinin verilənlər bazası və məlumatların idarə edilməsi aspektlərini, verilənlərin əvvəlcədən işlənməsini, model və nəticə çıxarma mülahizələrini, maraqlılıq ölçülərini, mürəkkəblik mülahizələrini, aşkar edilmiş strukturların sonrakı emalını, vizuallaşdırmanı və onlayn yeniləməni əhatə edir.^[1]

"Data mining" səhv addır, çünki məqsəd məlumatların özünün çıxarılması (hasilatı) deyil, böyük həcmdə məlumatlardan nümunələrin və biliklərin çıxarılmasıdır.^[6] O, həm də məşhur sözdür^[7] və genişmiqyaslı məlumatların və ya informasiya emalının istənilən formasına, eləcə də süni intellekt və biznes intellekti daxil olmaqla, qərar qəbuledici dəstək sisteminin hər hansı tətbiqinə tez-tez tətbiq olunur. Adətən daha ümumi terminlər, verilənlərin təhlili və analitikası və ya faktiki metodlara istinad etmək ya da süni intellekt və maşın öyrənməsi daha uyğundur.

Faktiki verilənlərin hasilatı tapşırığı, məlumat qeydləri qrupları, qeyri-adi qeydlər və asılılıqlar kimi əvvəllər naməlum, maraqlı nümunələri çıxartmaq üçün böyük miqdarda məlumatın yarı avtomatik və ya avtomatik təhlilidir. Bu, adətən fəza indeksləri kimi verilənlər bazası üsullarından istifadəni nəzərdə tutur. Bu nümunələr daha sonra daxil edilən məlumatların bir növ xülasəsi kimi görünə bilər və sonrakı təhlillərdə və ya maşın öyrənməsində və proqnozlaşdırıcı analitikada istifadə edilə bilər. Məsələn, verilənlərin öyrənilməsi mərhələsi verilənlərdə çoxlu qrupları müəyyən edə bilər, daha sonra qərar qəbuledici dəstək sistemi tərəfindən daha dəqiq proqnoz nəticələri əldə etmək üçün istifadə edilə bilər. Nə məlumatların toplanması, hazırlanması, nə də nəticələrin izahı və hesabatı əlavə mərhələlər kimi ümumi KDD prosesinə aid olsa da, məlumatların çıxardılması mərhələsinin bir hissəsi deyil.

Verilənlərin təhlili ilə hasilatı arasındakı fərq ondan ibarətdir ki, təhlil verilənlər bazasında modelləri və fərziyyələri yoxlamaq üçün istifadə olunur, məsələn, məlumatların miqdarından asılı olmayaraq marketinq kampaniyasının effektivliyini təhlil etmək. Hasilat isə əksinə olaraq böyük həcmdə məlumatda gizli nümunələri aşkar etmək üçün maşın öyrənməsi və statistik modellərdən istifadə edir.^[8]

"Məlumatların dərinləşdirilməsi", "məlumatların ovlanması" və "məlumatların izlənilməsi" terminləri aşkar edilmiş hər hansı nümunələrin etibarlılığı ilə bağlı etibarlı statistik nəticələr çıxarmaq üçün çox kiçik olan (və ya ola bilən) daha böyük toplunun hissələrinin nümunə götürülməsi üçün məlumatların çıxarılması metodlarının istifadəsinə aiddir. Bununla belə, bu üsullar daha böyük məlumat toplusuna qarşı test etmək üçün yeni fərziyyələrin yaradılmasında istifadə edilə bilər.

İstinadlar

↑ ¹ ² ³ "Data Mining Curriculum". ACM SIGKDD. 2006-04-30. 2013-10-14 tarixində arxivləşdirilib. İstifadə tarixi: 2014-01-27.
↑ Clifton, Christopher. "Encyclopædia Britannica: Definition of Data Mining". 2010. 2011-02-05 tarixində arxivləşdirilib. İstifadə tarixi: 2010-12-09.
↑ Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome. "The Elements of Statistical Learning: Data Mining, Inference, and Prediction". 2009. 2009-11-10 tarixində orijinalından arxivləşdirilib. İstifadə tarixi: 2012-08-07.
↑ Han, Jaiwei; Kamber, Micheline; Pei, Jian. Data Mining: Concepts and Techniques (3rd). Morgan Kaufmann. 2011. ISBN 978-0-12-381479-1.
↑ Fayyad, Usama; Piatetsky-Shapiro, Gregory; Smyth, Padhraic. "From Data Mining to Knowledge Discovery in Databases" (PDF). 1996. 2022-10-09 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 17 December 2008.
↑ Han, Jiawei; Kamber, Micheline. Data mining: concepts and techniques. Morgan Kaufmann. 2001. səh. 5. ISBN 978-1-55860-489-6. Thus, data mining should have been more appropriately named "knowledge mining from data," which is unfortunately somewhat long
↑ OKAIRP 2005 Fall Conference, Arizona State University Arxivləşdirilib 2014-02-01 at the Wayback Machine
↑ Olson, David L. "Data mining in business services". Service Business. 1 (3). 12 iyul 2007: 181–193. doi:10.1007/s11628-006-0014-7.

Xarici keçidlər

[acm-1] ¹ ² ³ "Data Mining Curriculum". ACM SIGKDD. 2006-04-30. 2013-10-14 tarixində arxivləşdirilib. İstifadə tarixi: 2014-01-27.

[brittanica-2] Clifton, Christopher. "Encyclopædia Britannica: Definition of Data Mining". 2010. 2011-02-05 tarixində arxivləşdirilib. İstifadə tarixi: 2010-12-09.

[elements-3] Hastie, Trevor; Tibshirani, Robert; Friedman, Jerome. "The Elements of Statistical Learning: Data Mining, Inference, and Prediction". 2009. 2009-11-10 tarixində orijinalından arxivləşdirilib. İstifadə tarixi: 2012-08-07.

[4] Han, Jaiwei; Kamber, Micheline; Pei, Jian. Data Mining: Concepts and Techniques (3rd). Morgan Kaufmann. 2011. ISBN 978-0-12-381479-1.

[Fayyad-5] Fayyad, Usama; Piatetsky-Shapiro, Gregory; Smyth, Padhraic. "From Data Mining to Knowledge Discovery in Databases" (PDF). 1996. 2022-10-09 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 17 December 2008.

[han-kamber-6] Han, Jiawei; Kamber, Micheline. Data mining: concepts and techniques. Morgan Kaufmann. 2001. səh. 5. ISBN 978-1-55860-489-6. Thus, data mining should have been more appropriately named "knowledge mining from data," which is unfortunately somewhat long

[7] OKAIRP 2005 Fall Conference, Arizona State University Arxivləşdirilib 2014-02-01 at the Wayback Machine

[8] Olson, David L. "Data mining in business services". Service Business. 1 (3). 12 iyul 2007: 181–193. doi:10.1007/s11628-006-0014-7.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

İnformatika
Cihaz	Sxem lövhəsi Periferiya qurğuları İnteqral sxem Çox geniş miqyaslı inteqrasiya Çip üzərində sistem Yaşıl hesablama Elektron dizaynın avtomatlaşdırılması Cihazın sürətləndirilməsi
Kompüter sistemlərinin təşkili	Kompüterin arxitekturası Gömülü sistemlər Real vaxtda hesablama Etibarlılıq
Şəbəkələr	Şəbəkə arxitekturası Verilənlərin ötürülməsi protokolları Şəbəkə avadanlığı Şəbəkə planlayıcısı Şəbəkə performansı Şəbəkə servisi
Proqram təminatının təşkili	İnterpretator Aralıq proqram təminatı Virtual maşın Əməliyyat sistemi Proqramın keyfiyyəti
Nəzəriyyə və alətlər	Proqramlaşdırma paradiqması Proqramlaşdırma dili Kompilyator Domenə özəl dil Modelləşdirmə dili Freymvork İnteqrasiya olunmuş inkişaf mühiti Proqram konfiqurasiyasının idarə edilməsi Proqram kitabxanası Repozitoriya
Proqram tərtibatı	Nəzarət axını Proqram təminatı prosesi Tələblərin təhlili Proqram dizaynı Proqramın qurulması Proqramın yerləşdirilməsi Proqram təminatı mühəndisliyi Proqram təminatının texniki qulluğu Proqramlaşdırma komandası Açıq mənbəli proqram təminatı
Alqoritmlər nəzəriyyəsi	Hesablama modeli Formal dillər Avtomatlaşdırma nəzəriyyəsi Hesablama nəzəriyyəsi Hesablama mürəkkəbliyi nəzəriyyəsi Məntiq Semantika
Alqoritmlər	Alqoritmin dizaynı Alqoritmin analizi Alqoritmik səmərəlilik Təsadüfi alqoritm Hesablama həndəsəsi
Hesablama riyaziyyatı	Diskret riyaziyyat Ehtimal Statistika Riyazi proqram təminatı İnformasiya nəzəriyyəsi Riyazi analiz Ədədi analiz Nəzəri informatika
İnformasiya sistemi	Verilənlər bazası idarəetmə sistemləri Kompüter məlumatlarının saxlanması Müəssisə məlumat sistemi Sosial proqram Coğrafi informasiya sistemi Qərar qəbuledici dəstək sistemi Prosessə nəzarət sistemi Multimedia verilənlər bazası Data mining Elektron kitabxana Kompüter platforması Rəqəmsal marketinq Ümumdünya hörümçək toru İnformasiya axtarışı
Kibertəhlükəsizlik	Kriptoqrafiya Formal metodlar Təhlükəsizlik xidməti Müdaxilənin aşkarlanması sistemi Cihaz təhlükəsizliyi Şəbəkə təhlükəsizliyi İnformasiya təhlükəsizliyi Tətbiq təhlükəsizliyi
İnsan-kompüter qarşılıqlı əlaqəsi	Qarşılıqlı təsir dizaynı Sosial hesablama Hər yerdə hesablama Vizualizasiya Kompüter əlçatanlığı
Paralellik	Paralel hesablama Paylanmış hesablama Çoxaxınlılıq Çoxprosesli
Süni intellekt	Təbii dilin emalı Bilik təmsili və əsaslandırma Kompüter görünüşü Avtomatlaşdırılmış planlaşdırma Optimallaşdırma İdarəetmə nəzəriyyəsi Süni intellekt fəlsəfəsi Paylanmış süni intellekt
Maşın öyrənməsi	Nəzarət olunan öyrənmə Nəzarət olunmayan öyrənmə Möhkəmləndirici öyrənmə Çox tapşırıqlı öyrənmə Çapraz doğrulama (statistika)
Qrafika	Animasiya Render Foto manipulyasiyası Qrafik prosessor Qarışıq reallıq Virtual reallıq Şəklin sıxışdırılması Solid modeling
Tətbiqi hesablama	Elektron ticarət Müəssisə proqram təminatı Hesablama riyaziyyatı Hesablama fizikası Hesablama kimyası Hesablama biologiyası Hesablama sosial elmləri Hesablama mühəndisliyi Sağlamlıq informatikası Rəqəmsal sənət Elektron nəşriyyat Kibermüharibə Elektron seçki Videooyunlar Mətn prosessoru Əməliyyat araşdırması Kompüter-dəstəkli təlim Sənəd idarəetmə
Kateqoriya Əsasları Vikianbar

Lüğətlər və ensiklopediyalar	Böyük katalan · Britannica (onlayn)
Normativ yoxlama	GND: 4428654-5 · LCCN: sh97002073 · Microsoft: 124101348, 2777516300 · NDL: 00948240 · NKC: ph165954