Böyük verilənlər (ing. Big data) termini ilk dəfə 1998-ci ildə Silicon Graphics kompaniyasının kompüter elmləri üzrə mütəxəssisi Con Meşi (“Big Data and the Next Wave of InfraStress" adlı seminarda məruzə) tərəfindən istifadə edilmişdir. Bu terminə bir qədər sonra, 2000-ci ildə, F.Dieboldun akademik mühitdə dərc olunan tədqiqatında rast gəlinir. Lakin termin, 100 ildən çox tarixə malik (1869-cu ildən nəşr olunan) həftəlik “Nature” jurnalının 2008-ci il sentyabr ayının “big data” mövzusuna həsr olunmuş xüsusi nömrəsində professor Klifford Linçin (Clifford Lynch) “Böyük verilənlər. Sizin verilənlər necə böyüyür?” (“Big Data: How do your data grow?”) adlı məqaləsi ilə populyarlıq qazanmışdır.
Böyük verilənlərə maraq 2011-ci ildən artmağa başlamışdır [1]. Mütəxəssislər BV-ni bəzən mineral resurslarla – böyük filiz mədəni (largeore) [2], yeni neft (new oil) [3], gizli biliklərin mənbəyi kimi “data mining” [4], təbiət kataklizmləri (data tornado, data deluge), təbii fəlakət (sunami) və s. ilə müqayisə edirlər [5]. Onlar qeyd edirlər ki, verilənlərin dəyərini başa düşənlər üçün XXI əsrdə verilənlər XVIII əsrdə istifadə olunmamış neft kimi çox qiymətli aktiv hesab olunur [6]. 2012-ci ildə Davosda Beynəlxalq İqtisadi Forumda böyük verilənər (BV) valyuta [7] və ya qızıl kimi yeni sinif iqtisadi aktiv kimi bəyan edilmişdir [8]. Bəzən bu problemi Mur qanunu kimi də interpretasiya edirlər.
Bu termin o verilənlər dəstinə aid edilir ki, onun həcminə informasiyanın daxil edilməsi, saxlanılması, idarə edilməsi və analizi üçün tipik verilənlər bazasının imkanları çatmır.
BV Google, Amazon, Facebook kimi nəhəng kompaniyalar, CERN (European Organization for Nuclear Research), NASA (National Aeronautics and Space Administration) tərəfindən həyata keçirilən elmi layihələrdə analiz edilməkdədir [9].
Böyük verilənlər dedikdə “həcmi mövcud üsul və sistemlərin imkanlarını ötüb keçən verilənlər” təsəvvür edilir. “Böyük” məfhumu mövcud hesablama səviyyəsinə görə nisbidir. Massaçusets Texnologiya İnstitutunun professoru S. Madden “böyük verilənlər”i “çox böyük”, “çox sürətli”, “cox çətin” kimi təsvir edir. Burada “çox çətin” ifadəsi mövcud alətlərlə emal oluna bilməyən verilənlərə aiddir [10]. Stuart Ward və Adam Barker bu ideyaları ümumiləşdirərək böyük verilənləri böyük və ya mürəkkəb verilənlər dəstinin saxlanması və analizi NoSQL, MapReduce, maşın təlimi ilə məhdudlaşmayan bir sıra üsulların köməyi ilə təsvir edilən termin kimi təyin etmişlər [11]. Göründüyü kimi, BV-nin anlaşılmasında 3V modelini daha çox istifadə olunan və geniş yayılmış tərif kimi qəbul etmək olar [12]. Çünki bu model uyğun texnologiya və məhsullara olan tələbləri əldə etmək üçün Böyük verilənləri daha yaxşı xarakterizə edir [13].
Data virtuallaşdırma bir yerdə çox mənbələrdən məlumat toplamaq üçün bir yoldur. Assambleya virtualdır: Digər metodlardan fərqli olaraq, məlumatların əksəriyyəti mənşə yerində qalır və tələb olunan xammal mənbələrindən əldə edilir.[14]