Datenwissenschaft ist die Lehre von der Extraktion von Wissen aus Daten. Sie verwendet verschiedene Techniken aus vielen Bereichen, darunter Signalverarbeitung, Mathematik, Wahrscheinlichkeitsrechnung, maschinelles Lernen, Computerprogrammierung, Statistik, Datentechnik, Mustervergleich und Datenvisualisierung, mit dem Ziel, aus den Daten nützliches Wissen zu extrahieren. Da Computersysteme in der Lage sind, mehr Daten zu verarbeiten, sind große Daten ein wichtiger Aspekt der Datenwissenschaft.
Eine Person, die Datenwissenschaft betreibt, wird als Datenwissenschaftler bezeichnet. Datenwissenschaftler lösen komplizierte Datenprobleme mit Hilfe von Mathematik, Statistik und Informatik, wobei sehr gute Kenntnisse in diesen Fächern nicht erforderlich sind. Allerdings ist ein Datenwissenschaftler höchstwahrscheinlich nur in einer oder zwei dieser Disziplinen ein Experte, was bedeutet, dass disziplinübergreifende Teams eine Schlüsselkomponente der Datenwissenschaft sein können.
Gute Datenwissenschaftler sind in der Lage, ihre Fähigkeiten einzusetzen, um viele verschiedene Zwecke zu erreichen. Ihre Fähigkeiten und Kompetenzen sind sehr unterschiedlich.