Tobias Quadfasel, Dissertation, Fachbereich Physik der Universität Hamburg, 2024 :

"Eine modell-agnostische Suche nach Physik jenseits des Standardmodells in der Zwei-Jet Topologie unter Anwendung von maschinellem Lernen"


"A Model-Agnostic Search for Beyond the Standard Model Physics in the Dijet Topology using Machine Learning"



Summary

Kurzfassung

Trotz signifikanter Anstrengungen der Kollaborationen am LHC und darüber hinaus nach Physik jenseits des Standardmodells zu suchen, konnten bisher keine Beweise für deren Existenz gefunden werden. Modellunabhängige Suchen ergänzen aktuelle Anstrengungen, da sie den Nachweis potenzieller neuer Physik-Anomalien erlauben, ohne auf ein spezifisches Signalmodell abzuzielen. Diese Arbeit diskutiert die Entwicklung und Anwendung neuartiger, datengetriebener Methoden für modellunabhängige Erkennung von Anomalien. Insbesondere wird eine neue Methode – genannt Cathode – auf Basis von neuronaler Dichteabschätzung und schwacher Klassifikation entwickelt, welche die bisher beste Leistung auf einem häufig genutzten Benchmark-Datensatz erreicht. Die erste Anwendung von Cathode sowie anderen auf maschinellem Lernen basierenden Methoden auf Proton-Proton Kollisionsdaten vom CMS experiment, welche von 2016 bis 2018 bei einer Schwerpunktsenergie von √𝑠 = 13 TeV gemessen wurden, wird diskutiert. Insbesondere wird nach hardonischen Resonanzen im Endzustand mit zwei Jets gesucht. Eine generische Suche für neue Physik im invarianten Massenspektrum des Zwei-Jet-Systems zeigte keinen signifikanten Überschuss an Ereignissen. In Bezug auf den Grenzwert des Wirkungsquerschnitts erreicht Cathode die sensitivsten Ergebnisse für mehrere der gesteten Massehypothesen eines 𝑋 → 𝑌 𝑌 ′ → 4𝑞 Signalmodells, wobei die optimale Verbesserung gegenüber einer inklusiven Suche den Faktor 1.9 betrug. Mehrere Verbesserungen des ursprünglichen Cathode-Algorithmus werden vorgeschlagen. Latent Cathode ermöglicht die Extraktion des Signals auch im Falle von starken Korrelationen zwischen den Eingabemerkmalen und der Masse, indem die schwache Klassifikation im latenten Raum durchgeführt wird. Es wird gezeigt, dass die Nutzung von Gradient-Boosting-Klassifikatoren anstelle von auf Deep Learning basierenden Methoden in der schwachen Klassifikation deutlich robuster gegenüber nicht informativen Merkmalen ist, was modellunabhängige Suchen ohne deren vorherige Auswahl ermöglicht.

Titel

Kurzfassung

Summary

Despite significant efforts to search for new beyond the Standard Model phenomena at the LHC physics program and beyond, no evidence has been found so far. Model-agnostic searches complement current search efforts, allowing for the detection of potential new physics anomalies without targeting a particular signal model. This thesis discusses the development and application of novel data-driven methods for model-agnostic anomaly detection. In particular, a new method based on neural density estimation and weak classification – named Cathode – is developed, achieving state-of-the-art performance on a commonly used benchmark data set. The first application of Cathode and other Machine Learning-based methods on proton-proton collision data taken at the CMS experiment from 2016 to 2018 at a centre-of-mass energy of √𝑠 = 13 TeV is discussed. Specifically, hadronic resonances in the two-jet final state are targeted. A generic search for new physics in the invariant mass spectrum of the two jets revealed no significant excess. In terms of cross-section limits, Cathode achieves the most sensitive results for several of the tested mass hypotheses of an 𝑋 → 𝑌 𝑌 ′ → 4𝑞 signal model, with an optimal improvement over an inclusive search of factor 1.9. Several improvements to the original Cathode algorithm are proposed. Latent Cathode allows for signal extraction in the case of strong correlations between input features and mass by conducting the weak classification in latent space. Using Gradient Boosting classifiers instead of Deep Learning-based methods in weak classification is shown to be considerably more robust against uninformative features, allowing for model-agnostic searches without prior feature selection.