Logo Logo
Help
Contact
Switch language to German
Calibration of machine learning based hadronic tagging in preparation for a Vcb measurement and clustering of kinematic distributions
Calibration of machine learning based hadronic tagging in preparation for a Vcb measurement and clustering of kinematic distributions
Measurements of the decay rate ratios R(D(*)) of B -> D(*) tau nu and B -> D(*) ℓ nu decays (ℓ=e, mu) show a substantial tension with the predictions of the Standard Model of particle physics. This thesis explores multiple topics that can facilitate a better understanding of these so-called flavor anomalies. These flavor anomalies may point to contributions of physics beyond the Standard Model, however the large, unexplored parameter space defining such contributions makes exploratory physics studies challenging. Clustering algorithms can divide this parameter space into subsets featuring similar decay kinematics, which helps to simplify studies. I present an open-source software package that makes such techniques accessible and demonstrate its application on the B -> D(*) tau nu decay, which is speculated to be responsible for the R(D(*)) anomalies. Furthermore, I show preparations for a study of the decay e-e+ -> Upsilon(4S) -> Btag (-> hadrons) Bsig (-> D* ℓ nu) with the dataset of the Belle experiment. Besides being of interest as the normalization channel of the R(D*) ratio, this decay also allows for the measurement of the CKM matrix element Vcb and for fits to hadronic form factors. One of the significant improvements of this study over previous studies at Belle is the use of the Full Event Interpretation (FEI), a machine learning algorithm that is able to reconstruct several thousand possible Btag decays. However, this algorithm is sensitive to inaccuracies in the modeling of the Monte Carlo simulation used throughout the analysis, leading to different efficiencies on simulated and recorded data. To correct these efficiency differences, I reconstruct the decay e-e+ -> Upsilon(4S) -> Btag (-> hadrons) Bsig (-> X ℓ nu). Assuming that the reconstruction efficiencies of the X ℓ nu decay are well-understood, any efficiency difference between data and Monte Carlo simulation can be attributed to the FEI and hence used for its calibration. Along with its effect on the overall reconstruction efficiency, the calibration also affects important observables used for background subtraction in Vcb and R(D(*)) analyses. I validate the calibration with a sample of B -> D ℓ nu decays and perform additional studies to confirm the validity of core assumptions of the calibration procedure. The calibration of Btag mesons with correctly and incorrectly reconstructed flavors are found to differ, which was not accounted for in previous analyses. I successfully explore several correction strategies on a preliminary dataset. As the FEI is used heavily at both Belle and Belle II, this result has significant implications for many past and upcoming analyses. The success of the FEI also highlights the importance of using state-of-the-art software technologies in modern measurements. To deliver the best possible science, large experimental collaborations are increasingly focusing on software education. I present recent developments in the software training activities that I have coordinated at Belle II and at the High Energy Physics Software Foundation (HSF)., Messungen der Verhältnisse R(D(*)) der Zerfallsraten von B -> D(*) tau nu und B -> D(*) ℓ nu (ℓ=e, mu) zeigen erhebliche Abweichungen zu den Vorhersagen des Standardmodells der Teilchenphysik. Die vorliegende Arbeit präsentiert verschiedene Ergebnisse, die zu einem verbesserten Verständnis dieser Anomalien beitragen können. Die Abweichungen können als Effekte von Physik jenseits des Standardmodells interpretiert werden. Der Parameterraum, der diese Effekte beschreibt, ist aufgrund seiner Größe jedoch eine Herausforderung für theoretische wie experimentelle Studien. Clusteranalysen können diesen Parameterraum in Teilmengen mit ähnlichen Zerfallskinematiken unterteilen, um entsprechende Untersuchungen zu vereinfachen. Ich stelle ein Open-Source-Softwarepaket vor, das derartige Methoden implementiert und wende es auf den B -> D(*) tau nu-Zerfall an, der für die R(D(*))-Anomalien verantwortlich gemacht wird. Weiterhin zeige ich Vorbereitungen für eine Messung des Zerfalls e-e+ -> Upsilon(4S) -> Btag (-> Hadronen) Bsig (-> D* ℓ nu) mit dem Datensatz des Belle-Experiments. Neben seiner Bedeutung als Normalisierungskanal der R(D*)-Observable erlaubt dieser Prozess die Messung des CKM-Matrix-Elements Vcb und die Extrapolation hadronischer Formfaktoren. Eine der entscheidenden Verbesserungen dieser Messung gegenüber Vorgängerstudien ist die Verwendung der Full Event Interpretation (FEI). Dieser Machine-Learning-Algorithmus rekonstruiert Btag-Mesonen in mehreren tausend Zerfallskanälen. Allerdings führen Ungenauigkeiten in der für die Analyse essenziellen Monte-Carlo-Simulation zu Effizienzunterschieden der FEI zwischen simulierten und gemessenen Daten. Um diese Effizienzunterschiede zu korrigieren, rekonstruiere ich den Zerfall e-e+ -> Upsilon(4S) -> Btag (-> Hadronen) Bsig (-> X ℓ nu). Unter der Annahme, dass die Rekonstruktionseffizienzen von X ℓ nu ausreichend verstanden sind, lassen sich die Effizienzunterschiede zwischen Daten und Monte-Carlo-Simulation der FEI zuordnen, sodass eine Kalibrierung vorgenommen werden kann. Neben der Korrektur der Gesamteffizienz beeinflusst die Kalibrierung auch wichtige Observablen für die Signalextraktion in Vcb- und R(D(*))-Analysen. Zur Validierung der Kalibrierung betrachte ich B -> D ℓ nu-Zerfälle und führe weitere Studien zur Bestätigung zentraler Annahmen der Kalibrierungsmethodik durch. Es zeigt sich, dass sich die Kalibrierung für Btag-Mesonen mit korrekt und inkorrekt rekonstruiertem flavor wesentlich unterscheidet, was in früheren Analysen nicht berücksichtigt wurde. Für eine Korrektur dieses Effekts präsentiere ich mehrere Strategien, die ich erfolgreich auf einen vorläufigen Datensatz anwende. Aufgrund der zentralen Rolle der FEI für eine Vielzahl von Studien am Belle- und Belle II-Experiment sind diese Resultate von weitreichender Bedeutung. Der Erfolg der FEI verdeutlicht auch die Bedeutung neuester Softwaretechniken für moderne Messungen. Um das volle Potenzial der gemessenen Daten auszuschöpfen, investieren große Kollaborationen zunehmend in die Softwarekenntnisse ihrer Mitglieder. Ich zeige von mir koordinierte Aktivitäten am Belle II-Experiment und in der High Energy Physics Software Foundation (HSF).
Belle, Belle II, Machine Learning, Clustering, Calibration
Lieret, Kilian
2022
English
Universitätsbibliothek der Ludwig-Maximilians-Universität München
Lieret, Kilian (2022): Calibration of machine learning based hadronic tagging in preparation for a Vcb measurement and clustering of kinematic distributions = Kalibration eines Machine-Learning-Algorithmus für hadronisches Tagging zur Vorbereitung einer Vcb-Messung und Clustering von kinematischen Verteilungen. Dissertation, LMU München: Faculty of Physics
[img]
Preview
PDF
Lieret_Kilian.pdf

11MB

Abstract

Measurements of the decay rate ratios R(D(*)) of B -> D(*) tau nu and B -> D(*) ℓ nu decays (ℓ=e, mu) show a substantial tension with the predictions of the Standard Model of particle physics. This thesis explores multiple topics that can facilitate a better understanding of these so-called flavor anomalies. These flavor anomalies may point to contributions of physics beyond the Standard Model, however the large, unexplored parameter space defining such contributions makes exploratory physics studies challenging. Clustering algorithms can divide this parameter space into subsets featuring similar decay kinematics, which helps to simplify studies. I present an open-source software package that makes such techniques accessible and demonstrate its application on the B -> D(*) tau nu decay, which is speculated to be responsible for the R(D(*)) anomalies. Furthermore, I show preparations for a study of the decay e-e+ -> Upsilon(4S) -> Btag (-> hadrons) Bsig (-> D* ℓ nu) with the dataset of the Belle experiment. Besides being of interest as the normalization channel of the R(D*) ratio, this decay also allows for the measurement of the CKM matrix element Vcb and for fits to hadronic form factors. One of the significant improvements of this study over previous studies at Belle is the use of the Full Event Interpretation (FEI), a machine learning algorithm that is able to reconstruct several thousand possible Btag decays. However, this algorithm is sensitive to inaccuracies in the modeling of the Monte Carlo simulation used throughout the analysis, leading to different efficiencies on simulated and recorded data. To correct these efficiency differences, I reconstruct the decay e-e+ -> Upsilon(4S) -> Btag (-> hadrons) Bsig (-> X ℓ nu). Assuming that the reconstruction efficiencies of the X ℓ nu decay are well-understood, any efficiency difference between data and Monte Carlo simulation can be attributed to the FEI and hence used for its calibration. Along with its effect on the overall reconstruction efficiency, the calibration also affects important observables used for background subtraction in Vcb and R(D(*)) analyses. I validate the calibration with a sample of B -> D ℓ nu decays and perform additional studies to confirm the validity of core assumptions of the calibration procedure. The calibration of Btag mesons with correctly and incorrectly reconstructed flavors are found to differ, which was not accounted for in previous analyses. I successfully explore several correction strategies on a preliminary dataset. As the FEI is used heavily at both Belle and Belle II, this result has significant implications for many past and upcoming analyses. The success of the FEI also highlights the importance of using state-of-the-art software technologies in modern measurements. To deliver the best possible science, large experimental collaborations are increasingly focusing on software education. I present recent developments in the software training activities that I have coordinated at Belle II and at the High Energy Physics Software Foundation (HSF).

Abstract

Messungen der Verhältnisse R(D(*)) der Zerfallsraten von B -> D(*) tau nu und B -> D(*) ℓ nu (ℓ=e, mu) zeigen erhebliche Abweichungen zu den Vorhersagen des Standardmodells der Teilchenphysik. Die vorliegende Arbeit präsentiert verschiedene Ergebnisse, die zu einem verbesserten Verständnis dieser Anomalien beitragen können. Die Abweichungen können als Effekte von Physik jenseits des Standardmodells interpretiert werden. Der Parameterraum, der diese Effekte beschreibt, ist aufgrund seiner Größe jedoch eine Herausforderung für theoretische wie experimentelle Studien. Clusteranalysen können diesen Parameterraum in Teilmengen mit ähnlichen Zerfallskinematiken unterteilen, um entsprechende Untersuchungen zu vereinfachen. Ich stelle ein Open-Source-Softwarepaket vor, das derartige Methoden implementiert und wende es auf den B -> D(*) tau nu-Zerfall an, der für die R(D(*))-Anomalien verantwortlich gemacht wird. Weiterhin zeige ich Vorbereitungen für eine Messung des Zerfalls e-e+ -> Upsilon(4S) -> Btag (-> Hadronen) Bsig (-> D* ℓ nu) mit dem Datensatz des Belle-Experiments. Neben seiner Bedeutung als Normalisierungskanal der R(D*)-Observable erlaubt dieser Prozess die Messung des CKM-Matrix-Elements Vcb und die Extrapolation hadronischer Formfaktoren. Eine der entscheidenden Verbesserungen dieser Messung gegenüber Vorgängerstudien ist die Verwendung der Full Event Interpretation (FEI). Dieser Machine-Learning-Algorithmus rekonstruiert Btag-Mesonen in mehreren tausend Zerfallskanälen. Allerdings führen Ungenauigkeiten in der für die Analyse essenziellen Monte-Carlo-Simulation zu Effizienzunterschieden der FEI zwischen simulierten und gemessenen Daten. Um diese Effizienzunterschiede zu korrigieren, rekonstruiere ich den Zerfall e-e+ -> Upsilon(4S) -> Btag (-> Hadronen) Bsig (-> X ℓ nu). Unter der Annahme, dass die Rekonstruktionseffizienzen von X ℓ nu ausreichend verstanden sind, lassen sich die Effizienzunterschiede zwischen Daten und Monte-Carlo-Simulation der FEI zuordnen, sodass eine Kalibrierung vorgenommen werden kann. Neben der Korrektur der Gesamteffizienz beeinflusst die Kalibrierung auch wichtige Observablen für die Signalextraktion in Vcb- und R(D(*))-Analysen. Zur Validierung der Kalibrierung betrachte ich B -> D ℓ nu-Zerfälle und führe weitere Studien zur Bestätigung zentraler Annahmen der Kalibrierungsmethodik durch. Es zeigt sich, dass sich die Kalibrierung für Btag-Mesonen mit korrekt und inkorrekt rekonstruiertem flavor wesentlich unterscheidet, was in früheren Analysen nicht berücksichtigt wurde. Für eine Korrektur dieses Effekts präsentiere ich mehrere Strategien, die ich erfolgreich auf einen vorläufigen Datensatz anwende. Aufgrund der zentralen Rolle der FEI für eine Vielzahl von Studien am Belle- und Belle II-Experiment sind diese Resultate von weitreichender Bedeutung. Der Erfolg der FEI verdeutlicht auch die Bedeutung neuester Softwaretechniken für moderne Messungen. Um das volle Potenzial der gemessenen Daten auszuschöpfen, investieren große Kollaborationen zunehmend in die Softwarekenntnisse ihrer Mitglieder. Ich zeige von mir koordinierte Aktivitäten am Belle II-Experiment und in der High Energy Physics Software Foundation (HSF).