Technologien für Data Science, KI und People Analytics

Eine Reihe von Technologien stehen für Data Science, Künstliche Intelligenz im Human Resource Management und People Analytics bereit, um relevante Daten zu erfassen, zu speichern, zusammenzuführen, zu prüfen, aufzubereiten, zu analysieren, für Modelle zu nutzen sowie deren Ergebnisse in Dashboards zu visualisieren und anschließend an Dritte zu berichten.

Diese Technologien lassen sich nach unterschiedlichen Merkmalen ordnen, wie nach (a) Zugang und Kosten (Lizenz): Open Source, propietäre/kommerziell oder Mischformen zwischen beiden, (b) Einsatzschwerpunkt im People Analytics Prozess: Fokus in der Datenpipline von Datenspeicherung bis Reporting oder (c) Spezialisierungsgrad: Breite Nutzung für Data Science oder Fokus spezielle auf People Analytics.

Zudem können wird die Technologien nach ihrer Abstraktionsebene unterscheiden: Beispielsweise gibt es verschiedene Ansätze zur Speicherung, Zusammenführung, Integration und Verarbeitung von Daten (z.B. Datenbank, Data Warehouse, Data Lake, Lambda-Architektur). Hierzu wurden Lösungen mit verschiedenen Programmiersprachen entwickelt, wie SQL, Java, Python, Scala, C und C++.

Viele und wichtige für das Data Science genutzte Technologien sind Open Source Software (z.B. Programmiersprache Python, MySQL für Datenbanken, Hadoop für Big Data, KNIME oder Orange als Prozesssteuerungs- und Auswertungssoftware), wobei einige Anbieter besondere Leistungen für eine Open Soucre Lösung anbieten (z.B. Databricks für Apache Spark).

Nachfolgend präsentieren wir eine Liste mit bekannten und häufig genutzten Technologien für das Data Science im Allgemeinen und einigen speziell für das People Analytics entwickelten (kommerziellen) Lösungen in acht Kategorien.

Einige von diesen Tools nutzen wir derzeit, eine Reihe haben wir getestet, und manche stehen noch auf unserer Checkliste – Besonders zu den People Analytics Plattformen recherchieren wir derzeit und haben eine Reihe weiterer Anbieter und Produkte ermittelt.

Einige von diesen werden wir in Kürze auführlich anhand der verfürbaren Demoversionen testen, und unsere Ergebnisse hierzu zusammen mit weiteren Beobachtungen zum People Analytics Markt auf dieser Website in einem neuem Beitrag vorstellen.

Sie möchten hierzu informiert werden? Dann vernetzen Sie sich mit Stefan Klemens auf LinkedIn.

Bitte beachten Sie auch unsere Hinweis am Ende.


Nr.NameKategorieOpen SourceBetriebssystem / ProgrammierspracheWebsite
1PythonProgrammierspracheJaLinux, OS X, Windowshttps://www.python.org
2NetcupCloud ComputingNeinLinux, Windowshttps://www.netcup.eu
3Amazon Web Services (AWS)Cloud ComputingNeinLinux, Windowshttps://aws.amazon.com
4SnowflakeCloud ComputingNeinGoogle Cloud Platformhttps://www.snowflake.com
5OpenStackCloud ComputingJaGNU/Linux, Pythonhttps://www.openstack.org
6Apache SparkFramework (Data Engineering)JaLinux, OS X, Windows, Scala, Java, Pythonhttps://spark.apache.org
7DatabricksPlattform für Apache SparkNeinWindows, OS X, Linux, Scala, Java, Pythonhttps://www.databricks.com
8AnacondaFramework (Data Science)Ja, BasisversionLinux, OS X, Windows, Python, Rhttps://www.anaconda.com
9JASPSoftware (Statistik, Maschinelles Lernen)JaLinux, OS X, Windows, C++, Rhttps://www.jasp-stats.org
10OrangeSoftware (Data Sience: Datenanalyse: Data Mining, Machine Learning, Visualization)JaLinux, OS X, Windows, Python, C++, Chttps://orangedatamining.com
11KNIMESoftware (Data Science: Datenanalyse: Data Mining, Machine Learning, Visualization)JaLinux, OS X, Windows, Javahttps://www.knime.com
12MicroStrategySoftware (Business Intelligence, Cloud Services, Visualisization, Reporting)NeinWindows, Linux, SQL, MDX, u.a.https://www.microstrategy.com
13Power BI (Mircosoft)Software (Business Intelligence, Cloud Services, Visualisization, Reporting)NeinWindows, DAX, "M", SQL, MDX, R, Pythonhttps://powerbi.microsoft.com
14TableauSoftware (Business Intelligence, Cloud Services, Visualisization, Reporting)NeinWindows, C++, Visual Query Languagehttps://www.tableau.com
15KerasFramework (Deep Learning)JaLinux, OS X, Windows, Pythonhttps://www.keras.io
16TensorFlowFramework (Maschinelles Lernen, Deep Learning)JaLinux, OS X, Windows, C++, Pythonhttps://www.tensorflow.org

Programmiersprachen

Python
R
Scala
SQL

Server für IT-Infrastruktur, Infrastructure as a Cloud (IaaC)

1blu
All-Inkl.
Digital Ocean
Hetzner
IONOS (1 & 1)
Landsol
Netcup
Strato (1 & 1)

Cloud-Plattformen, Cloud Computing

Amazon: AWS
Google Cloud
IBM
Microsoft: Azure
Oracle
Snowflake
Splunk

Speicherung, Integration und Verarbeitung von Daten

Apache Cassandra
Apache Flink
Apache Hadoop
Apache Kafka
Apache Spark
Cloudera (Hadoop-Distribution)
Databricks (Apache Spark)
Hortonworks (Hadoop-Distribution)
MapR (Hadoop-Distribution)
MongoDB
Redis
Splunk

Data Science Plattformen & Software

Anaconda
Dataiku
IBM SPSS Statistics und IBM SPSS Modeler
IBM Watson Studio und IBM Watson
JASP
KNIME
MicroStrategy
Orange
Power BI
RapidMiner
SAS
Splunk
Weka: Waikato Environment for Knowledge Analysis)
Wolfram Alpha

People Analytics Plattformen & Software

atwork
Bizneo HR
Crunchr
functionHR
Haufe People Operations HR-Software
HRForecast
IBM Workforce Planning
People-Analytix
Personio
One Model
OrgVue
Qualtrics People Analytics
SAP SuccessFaktors
Sisense
SplashBI
Visier People

Hinweis: Zu den People Analytics Anbietern und ihren Produkten sowie Informationen zum Markt folgt im Mai 2023 eine detailierte Tabelle und Analyse. Updates hierzu per Vernetzung über LinkedIn.

Machine Learning Bibliotheken (Module)

Apache Mahout
H2O.ai
Keras
PySpark
PyTorch
Spark Mllib
Tensorflow

Visualisierung

MicroStrategy
Power BI (Microsoft)
Tableau


Hinweise zu dieser Technologie-Liste:

(a) Diese Liste haben wir sorgfältig erstellt, doch natürlich erheben wir keinen Anspruch auf Vollständigkeit und Fehlerfreiheit.

(b) Ein Eintrag bedeutet nicht, dass wir die die entprechende Lösung audrücklich oder allgemein empfehlen oder selbst nutzen. Der Einsatz eine bestimmten Technologie hängt stets von einer Reihe von Faktoren ab wie Budget, Datensicherheit, Erfahrung, HR-Strategie, IT-Infrastruktur, Passung mit vorhandenen und anderen Technologien, Zeitplan und Ziele.

(c) Festgestellt werden kann jedoch, dass (1.) die Programmiersprache Python das Data Science mehr und mehr dominiert, (2.) Apache Spark im Bereich Data Engineering an Boden gewinnt sowie (3.) Anaconda, Jupyter Notebook, JASP, KNIME und Orange wichtige und/oder interessante Plattformen für das Data Science sind.

(e) Weitere Übersichten und Hinweise zu Technologien finden Sie z.B. in den Büchern von Oettinger (2020), Papp u.a. (2022) und Rudel (2021) sowie die relativ bekannte “Machine Learning, AI and Data (MAD) Landscape” von Matt Turck unter https://mattturck.com/data2021.

(f) Für den speziellen People Analytics Plattform- und Softwaremarkt empfehlen wir die Marktbeobachtungen und Ergebnisse von RedThread Research und ihren aktuellen “People Analytics Technology 2022: Full Report” unter https://redthreadresearch.com. (Hinweis: US-Markt). Update: Neue Studie und Report zum People Analytics Markt im April und Juni 2023.

(g) Diese Liste aktualisieren wir von Zeit zu Zeit. Wenn Sie über neue Inhalte nach Erscheinen informiert werden möchten, dann empfehlen wir den kostenfreien Empfang unseres Newsletters “Schorberg Report”. Oder schneller: Vernetzen Sie sich mit Stefan Klemens auf LinkedIn.