Adattudomány - mi ez, definíció és fogalom

Tartalomjegyzék:

Adattudomány - mi ez, definíció és fogalom
Adattudomány - mi ez, definíció és fogalom
Anonim

Az adattudomány olyan tudományág, amely azt vizsgálja, hogy egy bizonyos információs bázis honnan származik. Azt is megvitatja, hogyan lehet ezeket az erőforrásokat értelmezni és képviselni produktív felhasználás céljából.

Vagyis az adattudomány az adatbázisok kezelésével kapcsolatos, digitális fájlokban tárolt adatok, amelyekből statisztikai mutatókként sok hasznos információt lehet kinyerni. Ezek segíthetnek például egy vállalatnak üzleti döntések meghozatalában.

Hasonlóképpen, az adattudomány olyan eszközöket is kínál, amelyek lehetővé teszik nemcsak a tolmácsolás értelmezését, hanem például a képeken való ábrázolását is. Így megvan többek között a hisztogram, az oszlopdiagram, a kördiagram.

Amint arra lehet következtetni, ez a tudomány interdiszciplináris, mivel elsősorban a matematika, a statisztika és az informatika ismereteit fedi le.

Adattudomány és adattípusok

Azt is meg kell jegyezni, hogy az adattudomány kétféle adattal működhet:

  • Szerkezet: Rendszerezettek, például különböző oszlopokkal rendelkező táblázatok, amelyek mindegyikének más kategóriája van, például: név, vezetéknév, életkor, személyazonosító okmány száma stb.
  • Strukturálatlan: Azok, amelyek nem felelnek meg egy bizonyos formátumnak, például egy szabadon írt szöveg. Ebben az esetben értelmeznie kell a kezelhető tartalmat és kinyernie az adatokat.

Figyelembe véve mindazt, amit kifejtettek, az adattudományra szakosodott szakembereknek nemcsak elemző készségekkel kell rendelkezniük, hanem képesnek kell lenniük az általuk feldolgozott információk tartalmának közlésére is.

Az adattudomány jelentősége

Az adattudomány fontos azoknak a vállalatoknak vagy intézményeknek, amelyeknek nagy mennyiségű adattal kell dolgozniuk. Így ezek értékes információkká válhatnak.

Összekapcsolhatjuk az adattudományt a Big Data-val, amely a különféle forrásokból származó hatalmas adatok feldolgozására és kezelésére alkalmas mechanizmusok kifejlesztéséből áll. A cél az, hogy ezeket olyan információkká alakítsák át, amelyek képesek az ember által értelmezhetővé válni, és amelyek segítenek döntéseket hozni.

A feldolgozásra kerülő adatok származhatnak magánszemélyek és szervezetek közötti tranzakciókból (például banki műveletek), napi tevékenységekből (például internetes keresések), gépekből (például a mobiltelefon GPS-je, amely rögzíti a felhasználó tartózkodási helyét) vagy információkból. biometrikus (például ujjlenyomat).

Az adattudomány története

Elmondható, hogy az amerikai statisztikus, John Wilder Tukey az 1960-as években úttörő szerepet játszott az adattudományban, hangsúlyozva az adatok elemzésének fontosságát, nem pedig a statisztikai modellek tesztelését.

Az adattudomány kifejezést azonban csak 1996-ban használták először egy előadás címében, az "Adattudomány, osztályozás és kapcsolódó módszerek" című előadásban. Ezt a „Nemzetközi Osztályozó Társaságok Nemzetközi Szövetségének” (IFCS) a japán Kobe-ban tartott taggyűlésén belül.

Egy másik fontos mérföldkő 2005-ben volt, amikor a Nemzeti Tudományos Testület kiadta "A 21. századi kutatást és oktatást lehetővé tevő hosszú életű digitális adatgyűjteményeket". Ebben a dokumentumban az adatkutatókat számítógépes szakértőknek, adatbázis- és szoftverprogramozóknak, valamint más tudományterületek szakembereinek (például könyvtárosok és levéltárosok) határozzák meg, akik döntő fontosságúak a digitális adatgyűjtés sikeres kezeléséhez.

Ez azonban még mindig fejlesztés alatt álló tanulmányi terület.