Logo
Published on

Paper Talk - Learning Invariants of arithmetic curves

Authors
  • avatar
    Name
    Till Heller
    Twitter

In der Welt der Mathematik gibt es Objekte, die scheinbar harmlos beginnen – als Gleichungen, als Kurven in der Ebene – und sich dann als tiefgründige Strukturen mit weitreichenden Anwendungen entpuppen. Die elliptischen Kurven gehören genau in diese Kategorie. Wer sich für Algebra, Geometrie oder Zahlentheorie interessiert, kommt früher oder später an ihnen nicht vorbei.

Was ist eine elliptische Kurve?

Formal ist eine elliptische Kurve eine nicht-singuläre Kurve vom Grad drei mit einem ausgezeichneten Punkt (dem Punkt im Unendlichen), die über einem Körper KK definiert ist. In der einfachsten Form sieht sie so aus: E:y2=x3+ax+bE: y^2 = x^3 + ax + b, wobei a,bKa,b \in K so gewählt sind, dass die Diskriminante Δ=16(4a3+27b2)0\Delta = -16(4a^3 + 27b^2) \neq 0 gilt – diese Bedingung stellt sicher, dass die Kurve keine Singularitäten (Spitzen oder Doppelpunkte) hat.

Geometrisch betrachtet ergibt diese Gleichung eine glatte, symmetrische Kurve in der Ebene. Was sie so besonders macht: Man kann auf ihr eine Gruppenstruktur definieren – mit einer Addition, die rein geometrisch erklärt werden kann.

Die Gruppenstruktur – Geometrie trifft Algebra

Eine der faszinierendsten Eigenschaften elliptischer Kurven ist, dass ihre Punktemenge E(K)E(K) – also die Punkte auf der Kurve mit Koordinaten im Körper KK – eine abelsche Gruppe bildet.

Die Gruppenoperation funktioniert folgendermaßen:

Addition zweier Punkte: Zeichne die Gerade durch zwei Punkte PP und QQ auf der Kurve. Diese Gerade schneidet die Kurve (wegen des Grads drei) in genau einem dritten Punkt RR'. Reflektiere diesen Punkt an der x-Achse, und du erhältst den Punkt R=P+QR = P + Q.

Punktverdopplung: Wenn P=QP = Q, nimm stattdessen die Tangente an die Kurve im Punkt PP, um den dritten Schnittpunkt zu bestimmen.

Diese Operation ist nicht nur wohldefiniert, sondern erfüllt auch alle Gruppeneigenschaften.

Die rationalen Punkte einer Kurve

Ein zentrales Objekt des Interesses bei elliptischen Kurven ist die Gruppe der rationalen Punkte E(Q)E(\mathbb{Q}), also aller Punkte mit rationalen Koordinaten (plus dem Punkt im Unendlichen). Diese Gruppe ist nicht nur aus geometrischer Sicht elegant – sie besitzt auch eine überraschend präzise algebraische Struktur.

Der Satz von Mordell(-Weil)

Der Satz von Mordell (verallgemeinert durch Weil auf beliebige Zahlkörper) beschreibt die Struktur dieser Gruppe:

E(Q)E(Q)torsZrE(\mathbb{Q}) \cong E(\mathbb{Q})_{\text{tors}} \oplus \mathbb{Z}^r

Das bedeutet: Die Gruppe aller rationalen Punkte ist isomorph zu einem endlichen Torsionsteil E(Q)torsE(\mathbb{Q})_{\text{tors}} plus einem freien abelschen Anteil vom Rang rr.

Torsionsteil E(Q)torsE(\mathbb{Q})_{\text{tors}}

Der Torsionsteil besteht aus allen Punkten PE(Q)P \in E(\mathbb{Q}), für die es ein nNn \in \mathbb{N} gibt mit nP=OnP = \mathcal{O}, wobei O\mathcal{O} der neutrale Punkt ist.

Der berühmte Satz von Mazur klassifiziert alle möglichen Torsionsgruppen rationaler elliptischer Kurven:

  • Zyklen: Z/nZ\mathbb{Z}/n\mathbb{Z} für n=1,2,,10,12n = 1, 2, \dots, 10, 12
  • Produkte: Z/2Z×Z/2nZ\mathbb{Z}/2\mathbb{Z} \times \mathbb{Z}/2n\mathbb{Z} für n=1,2,3,4n = 1, 2, 3, 4

Das heißt: Es gibt genau 15 mögliche Torsionsgruppen für elliptische Kurven über Q\mathbb{Q}. Dieser Teil der Gruppe ist also streng begrenzt.

Rang rr

Der Rang misst die „Größe“ der unendlichen Komponente: Er gibt an, wie viele linear unabhängige, nicht-torsionale Punkte es auf der Kurve gibt. Jeder solcher Punkt kann als „Generator“ gesehen werden, mit dem man über die Gruppenoperation neue Punkte erzeugen kann.

Beispiel:

  • Rang 0 → Nur endlich viele Punkte auf E(Q)E(\mathbb{Q})
  • Rang 1 → Unendlich viele Punkte, erzeugt durch einen Punkt PP
  • Rang 2 oder mehr → Noch reichere Struktur

Obwohl der Torsionsteil vollständig klassifiziert ist, ist der Rang eines der großen offenen Themen in der Zahlentheorie. Eine Vermutung besagt, dass der Rang unbegrenzt ist, d.h. es gibt Kurven mit beliebig großem Rang. Die Kurve, mit dem aktuell größten, exakt bestimmten Rang hat Rang 20.

Beispiel: Struktur konkret

Nehmen wir die Kurve

E:y2=x3xE: y^2 = x^3 - x

Über Q\mathbb{Q} hat diese Kurve:

  • Torsionsgruppe: Z/4Z\mathbb{Z}/4\mathbb{Z}
  • Rang: 0

Die rationalen Punkte sind also endlich viele, z. B.:

O, (0,0), (1,0), (1,0)\mathcal{O},\ (0, 0),\ (1, 0),\ (-1, 0)

Demgegenüber hat etwa die Kurve

E:y2=x32E: y^2 = x^3 - 2

einen Rang von 1: Es existiert ein rationaler Punkt P=(3,5)P = (3,5), aus dem sich unendlich viele weitere durch wiederholte Addition erzeugen lassen.

Die L-Funktion einer elliptischen Kurve – und ihr Fingerabdruck in Daten

Neben der Gruppenstruktur ist ein weiteres fundamentales Objekt einer elliptischen Kurve E/QE/\mathbb{Q} ihre L-Funktion. Diese analytische Funktion verknüpft arithmetische Informationen (wie die Anzahl von Punkten modulo pp) mit tiefliegenden globalen Eigenschaften der Kurve. Überraschenderweise erlaubt sie sogar datenanalytische Methoden – etwa durch maschinelles Lernen auf Basis lokaler Informationen.

Lokale Faktoren und die apa_p-Koeffizienten

Für jede Primzahl pp, bei der die Kurve gute Reduktion hat, ist der lokale Eulerfaktor der L-Funktion gegeben durch:

Lp(E,T)=1apT+pT2L_p(E, T) = 1 - a_p T + p T^2

Dabei ist:

ap=p+1#E(Fp)a_p = p + 1 - \#E(\mathbb{F}_p)

Das heißt: apa_p misst die Abweichung der Anzahl der Punkte #E(Fp)\#E(\mathbb{F}_p) von der "erwarteten" Anzahl p+1p + 1, die bei einer zufälligen Kurve typischerweise auftritt. Für schlechte Reduktion (singuläre Reduktion modulo pp) wird der lokale Faktor vereinfacht zu:

Lp(E,T)=1apTL_p(E, T) = 1 - a_p T

In diesem Fall enthält apa_p Information über die Art der Reduktion – etwa, ob die reduzierte Kurve eine Knoten- oder Cuspsingularität hat.

Die globale L-Funktion

Die globale L-Funktion entsteht durch das unendliche Produkt über alle Primzahlen:

L(E,s)=pLp(E,ps)1L(E, s) = \prod_{p} L_p(E, p^{-s})^{-1}

Diese Funktion konvergiert in einem gewissen Bereich für (s)>3/2\Re(s) > 3/2 und lässt sich (vermutlich!) zu einer meromorphen Funktion über ganz C\mathbb{C} fortsetzen – eine der zentralen Aussagen der Birch–Swinnerton-Dyer-Vermutung. Die Ordnung der Nullstelle bei s=1s = 1 entspricht dem Rang der Kurve.

Aber was ist, wenn man diese apa_p-Werte aus praktischer Sicht betrachtet?

Feature-Vektoren aus apa_p: Maschinelles Lernen trifft Zahlentheorie

Die Folge der apa_p-Koeffizienten kann als numerischer Fingerabdruck einer elliptischen Kurve betrachten werden. Sei pip_i die ii-te Primzahl, dann definiert man für eine Kurve EE:

vL(E)=(ap1,ap2,,apN)ZN\mathbf{v}_L(E) = (a_{p_1}, a_{p_2}, \ldots, a_{p_N}) \in \mathbb{Z}^N

Dieser L-Vektor ist eine komprimierte, aber informative Darstellung der arithmetischen Struktur von EE.

Die apa_p-Koeffizienten, ursprünglich definiert über das Zählen von Punkten auf elliptischen Kurven modulo Primzahlen, lassen sich als hochinformative numerische Merkmale interpretieren. Im Paper "Machine Learning Invariants of Arithmetic Curves" zeigen He, Lee und Oliver, wie diese lokalen Daten als Feature-Vektoren genutzt werden können, um arithmetische Invarianten vorherzusagen – insbesondere den Rang von Kurven.

In einem Experiment mit Kurven vom Geschlecht 2 (also einer Verallgemeinerung elliptischer Kurven) wurde der Versuch unternommen, den Rang der Kurve als eine von drei Klassen (0, 1 oder 2) auf Basis der ersten apa_p-Werte vorherzusagen. Dazu wurde ein ausgewogener Datensatz mit etwa 30.000 Kurven erstellt. Ein einfacher logistischer Klassifikator erzielte dabei eine erstaunlich hohe Genauigkeit von ca. 97 % – trotz der Schwierigkeit des ternären Klassifikationsproblems.

Diese Ergebnisse legen nahe: Die L-Vektoren enthalten tiefergehende arithmetische Information, die über rein zufälliges Verhalten weit hinausgeht – und durch maschinelles Lernen effizient extrahiert werden kann. Damit verbindet sich moderne algorithmische Mathematik mit klassischen Fragestellungen der Zahlentheorie auf innovative Weise.


In dem erwähnten Paper werden weitere Invarianten mit ähnlich beeindruckenden Ergebnissen vorhergesagt.

Link zum Paper: Machine learning invariant of arithmetic curves - He, Lee & Oliver