Наука о подацима је дисциплина која проучава одакле потиче одређена база података. Такође се говори о томе како се ови ресурси могу тумачити и представљати за продуктивну употребу.
Односно, наука о подацима односи се на управљање базама података, ускладиштеним у дигиталним датотекама, из којих се као корисни статистички показатељи могу извући многе корисне информације. Они могу помоћи, на пример, предузећу у доношењу пословних одлука.
Слично томе, наука о подацима пружа алате који омогућавају не само тумачење, већ и представљање, на пример, на сликама доступних података. Тако између осталог имамо хистограм, тракасти дијаграм, кружни дијаграм.
Као што се може закључити, ова наука је интердисциплинарна, јер обухвата углавном знање из математике, статистике и рачунарства.
Наука о подацима и типови података
Такође треба напоменути да наука о подацима може да ради са две врсте података:
- Структурирано: То су они који су организовани, попут оних табела са различитим колонама, свака са другачијом категоријом, као што су: име, презиме, старост, број личног документа итд.
- Неструктурирано: Они који не одговарају одређеном формату, као што је слободно написан текст. У том случају морате да протумачите садржај и извучете податке којима можете управљати.
Узимајући у обзир све што је објашњено, професионалци специјализовани за науку о подацима морају не само да имају аналитичке вештине, већ морају да буду у стању да саопште садржај података које су обрадили.
Значај науке о подацима
Наука о подацима је важна за компаније или институције које морају да раде са великом количином података. Дакле, ово може постати драгоцена информација.
Науку података можемо повезати са великим подацима, који се састоје од развоја механизама способних за обраду и управљање масивним подацима који потичу из различитих извора. Циљ је претворити их у информације које људско биће може протумачити и које му помажу у доношењу одлука.
Ови подаци за обраду могу доћи из трансакција између појединаца и организација (као што су банкарске операције), свакодневних радњи људи (попут претраживања на Интернету), машина (као што је ГПС мобилног телефона који бележи где је корисник био) или информација биометријски (као што је отисак прста).
Историја науке о подацима
Може се рећи да је амерички статистичар Јохн Вилдер Тукеи био пионир науке о подацима 1960-их, истичући важност анализе података, а не тестирања статистичких модела.
Међутим, тек 1996. године појам наука о подацима први пут је коришћен у наслову предавања, у предавању под називом: „Наука о подацима, класификација и сродне методе“. Ово, у оквиру састанка чланова „Међународне федерације класификационих друштава“ (ИФЦС) одржаног у Кобеу, Јапан.
Још једна важна прекретница постигла се 2005. године када је Национални научни одбор објавио „Зивети дигиталне збирке података које омогућавају истраживање и образовање у 21. веку“. У том документу научници података дефинисани су као рачунарски стручњаци, програмери база података и софтвера и професионалци из других дисциплина (попут библиотекара и архивиста), који су пресудни за успешно управљање дигиталном колекцијом података.
Међутим, ово је још увек у фази проучавања.