Über dieses Blog

Hi, mein Name ist Matthias.

In diesem Blog teile ich meine Erfahrungen als Forscher und Berater zu den Themen Data Science und Machine Learning mit dem Schwerpunkt der Verarbeitung natürlicher Sprache (Natural Language Processing). In regelmäßigen Abständen veröffentliche ich hier Artikel sowohl zu Grundlagen als auch zu aktuellen Entwicklungen aus Wissenschaft und Praxis. Die Texte richten sich an interessierte Laien mit einem IT-Grundverständnis und kommen - soweit es in dieser Disziplin überhaupt möglich ist - ohne Fachjargon aus. Nur wenige Artikel setzen mathematisches Vorwissen voraus. Die Artikel sind kompakt geschrieben und in Themenseiten zusammengefasst. Themenwünsche, Verbesserungsvorschläge und Gastbeiträge sind jederzeit willkommen. Schreib dazu einfach eine E-Mail an matthias (-at-) dataleap.de.

Zurzeit arbeite ich als Postdoc und als Consultant im Bereich ML/NLP. Zur Verarbeitung und Analyse von strukturierten und unstrukturierten Daten setze ich auf die etablierten Tools des Python-ML-Ökosystems. Die besonderen Herausforderungen meiner Arbeit liegt vor allem in der Übersetzungsarbeit von Business Case zur Technik und der strategischen Bewertung der technischen Möglichkeiten die ML/NLP bietet. Mein persönliches Interesse gilt zudem der Anwendung von ML in der Biotechnologie und der Medizin.

Ich habe Informatik (Diplom) und anschließend Wirtschaftswissenschaft (Master) an der Rheinisch-Westfälische Technische Hochschule Aachen studiert und an der Schnittstelle zu beidem am Institut für Technologie- und Innovationsmanagement promoviert. Meine Dissertation trägt den Titel "Essays on Text Mining: Methodological Advances and Practical Applications to Scientific Texts".

Wissenschaftliche Veröffentlichungen

  • Matthias Rüdiger, David Antons, and Torsten-Oliver Salge (2022): Topic Modeling Revisited: New Evidence on Algorithm Performance and Quality Metrics. PLOSOne.
  • Matthias Rüdiger, David Antons, and Torsten-Oliver Salge (2021): The Explanatory Power of Citations - A New Approach to Unpacking Impact in Science. Scientometrics.
  • Matthias Rüdiger (2020): Essays on Text Mining: Methodological Advances and Practical Applications to Scientific Texts. Dissertation.
  • Matthias Rüdiger, David Antons, and Torsten-Oliver Salge (2018): Unpacking Impact in Science: The Explanatory Power of Citations. Proceedings of the International Conference on Information Systems (ICIS), San Francisco.
  • Matthias Rüdiger, David Antons, and Torsten-Oliver Salge (2017): From Text to Data: On the Role and Effect of Text Pre-Processing in Text Mining Research. Academy of Management Meeting (AOM), Atlanta.
  • Stephan Günnemann, Ines Färber, Matthias Rüdiger, and Thomas Seidl (2014): SMVC - Semi-Supervised Multi-View Clustering in Subspace Projections. ACM SIGKDD Conference on Knowledge Discovery and Data Mining, New York.