Statistische Überlegungen

  

der folgende Beitrag wird mit freundlicher Genehmigung von Franz Jittenmeier (Schachticker) hier nochmals abgedruckt:

Elo-Statistik vom November – eine kleine Zahlenspielerei
Publiziert am 1. November 2018 Von GM Gerry Hertneck

Von GM Hertneck, München

Wie jeden Monat kam Anfang November die neue Wertungsliste der FIDE heraus. Natürlich schaute ich gleich meine neue Zahl nach, und sie lag wie erwartet bei 2493. Die FIDE ist hier recht zuverlässig mit den Auswertungen. Ich hätte also einfach an anderer Stelle weiter surfen können. Doch diesmal war alles anders, denn ich lud die komplette Ratingliste herunter, und begann, diese statistisch zu analysieren, und zwar mit dem Hauptaugenmerk auf Deutschland.

Als erstes interessieren mich immer die Titelträger. Wie viele Großmeister gibt es wohl auf der Welt und welcher Anteil davon in Deutschland? Die Antwort ist der Tabelle zu entnehmen. Weltweit sind es ziemlich genau 1.600 und in Deutschland nähern wir uns mit 94 GM der Hundertermarke. Wieso so viele? Nun man muss bedenken, dass in dieser Liste auch die inaktiven Spieler enthalten sind (sie sind dann mit dem Kürzel i gekennzeichnet). Interessanterweise haben übrigens über 50 Prozent der Spieler in der Liste ein i wie inaktiv vermerkt. Denn da die Auswertungen monatlich erfolgen (früher alle 3 Monate und davor sogar nur alle 6 Monate), rutscht man schnell in die von der FIDE definierte Inaktivität.

Weiter gings mit der Auswertung der IMs und den FMs. Und im Anschluss mit den Titelträgern der Frauen. Interessant ist dabei auch die prozentuale Verteilung. Etwa 1 Prozent aller in der deutschen Rangliste vertretenen Spieler sind Internationaler Meister und sogar 3 Prozent FIDE-Meister.

Betrachtet man den Anteil der deutschen Titelträger an denen der Welt, so kommt man in der Regel auf eine Quote von 5 bis 6 Prozent. Das bedeutet im Schnitt: jeder 20. GM / IM / WGM / WIM / WFM kommt aus Deutschland oder ist in der deutschen Rangliste notiert. Eine bemerkenswerte Ausnahme ist die Anzahl der FM. Es ist Tatsache, dass 11 Prozent aller FIDE-Meister weltweit aus Deutschland kommen bzw. hier gelistet sind. Weshalb das? Offensichtlich weil wir einen sehr starken und aktiven Mittelbau haben.

Interessant ist auch die Frage nach den durchschnittlichen Werten. In unten stehender Tabelle ist die durchschnittliche ELO-Zahl und das durchschnittliche Geburtsjahr der deutschen Titelträger*innen erfasst. Auch hier zeigt sich ein interessantes Phänomen: Im Schnitt sind die Titelträger 46 bis 48 Jahre alt (!). Ausgenommen die FIDE-Meister, die sogar auf einen Altersschnitt von über 50 Jahren kommen. Wir halten fest: ein durchschnittlicher deutscher Großmeister hat also 2493 Elo (so wie ich) und ist 48 Jahre alt (also jünger als ich).

Verlassen wir damit die Welt der Titelträger und gehen in die Breite. In der deutschen Eloliste sind ziemlich genau 25.000 Spieler gelistet. Weltweit rund 320.000. Also kommen fast 8 Prozent der FIDE-Spieler aus Deutschland.

Oft wird bedauert, dass das deutsche Schach (wie auch die gesamte deutsche Gesellschaft) überaltert ist. Auch dieses Bild wird durch die Zahlen gestützt, denn sowohl der Median als auch der Mittelwert liegt in der deutschen Rangliste bei 50 Jahren. Geht man davon aus, dass man von 6 bis 80 Schach spielen kann, so müsste der Schnitt rein rechnerisch bei 37 Jahren liegen. Allerdings ist hier einschränkend darauf hinzuweisen, dass die Elozahl anders als die DWZ der Gradmesser für internationale Turniere und nicht nationale Turniere ist. Junge Spieler sind in der FIDE-Liste natürlich noch unterrepräsentiert.

Als nächstes stellte ich mir die Frage nach der durchschnittlichen Elozahl in der deutschen Rangliste. Hier liegt der Mittelwert knapp unter 1900 und der Median bei knapp über 1900, und damit höher als ich gedacht hätte. Der Vergleichswert bei der nationalen DWZ liegt irgendwo zwischen 1600 und 1650 liegt, wenn ich mich nicht irre.

Teilt man die Zahlen in Hunderterblöcke auf, so sieht man sieht recht deutlich, dass die meisten deutschen Spieler im Bereich von 1900 bis 2100 liegen.

Wenn man die Anzahl der deutschen Spieler in den Blöcken hingegen von oben nach unten aufsummiert, ergibt sich folgendes Bild:

Ups, wie kam Excel ganz unten trotz korrekter Formel auf 100,05 Prozent? Ich weiß es nicht…

Zu guter Letzt habe ich mir die Frage nach unseren Top-Talenten in Deutschland gestellt. Auch hier wurde ich überrascht.

Legt man bei den Männern die Kriterien Elo > 2450 und Alter kleiner 18 Jahre an, so spuckt die Statistik nur 3 Namen aus. Bei den Frauen sieht es noch schlechter aus. Hier komme ich bei Elo > 2300 und Alter kleiner 25 (!) nur auf zwei Spielerinnen. Natürlich wäre hier noch Annmarie Mütsch zu nennen, doch aktuell ist sie mit 2246 noch unter der von mir gewählten Grenze.

Um ein Fazit zu ziehen: das deutsche Schach ist zwar in der Breite gut aufgestellt, jedoch hat es sowohl eine demographisch ungünstige Altersstruktur als auch zu wenig junge Talente. Auch in der Spitze ist das deutsche Schach meines Erachtens gegenüber der Konkurrenz in den letzten 10 Jahren zurückgefallen, auch wenn ich dies in diesem Artikel statistisch nicht nachgewiesen habe. Aber auf den 14. Rang weltweit kann man nur bedingt stolz sein.

Top Juniorinnen

Top Junioren

Top GER-Frauen

Top GER

Top Frauen

Top Chart

Top 100

________________________________________________________________________________________________________

So weit der Artikel von GM Hertneck. Insbesondere seine Anmerkung zur Alterstruktur bedeutet für viele Schachvereineine ein Griff an die eigene Nase.

Für alle die es mit Mathematik und insbesondere mit der Statistik nicht so haben, hier ein paar Worte von Wikipedia und Oberlehrer Karlheinz:

Die Hälfte der Summe zweier Größen a und b ist gegeben durch:

  .

Da die Größen a , x ¯ , b eine Arithmetische Folge bilden, wird die Merkmalssumme der Merkmalsausprägung x 1 , x 2 , … , x n dividiert durch die Anzahl der Merkmalsträger

… der Vollständigkeit halber der geometrischer Mittelwert: Wurzel(a*b) ist hier außen vor.

Der Median teilt eine Liste von Werten in zwei Hälften. Er kann auf folgende Weise bestimmt werden:

  • Alle Werte werden (aufsteigend) geordnet.
  • Wenn die Anzahl der Werte ungerade ist, ist die mittlere Zahl der Median.
  • Wenn die Anzahl der Werte gerade ist, wird der Median meist als arithmetisches Mittel der beiden mittleren Zahlen definiert, die dann Unter– und Obermedian heißen.
  • Eine wichtige Eigenschaft des Medians ist Robustheit gegenüber Ausreißern.
    • Beispiel: sieben unsortierte Messwerte 4, 1, 15, 2, 4, 5, 4 werden nach Größe sortiert: 1, 2, 4, 4, 4, 5, 15; Der Median (auch der Ober- und der Untermedian) ist der Wert an der mittleren Stelle, also 4. Wenn im Beispiel durch einen Fehler eine 4 durch 46 ersetzt wurde, ändert sich der Median nicht: 1, 2, 4, 4, 5, 15, 46. Das arithmetische Mittel hingegen springt von 5 auf 11.

Da „Ausreißer“ weniger stark gewichtet werden, ist der Median für Spielstärkestatistiken besser geeignet.

… und nicht wundern: da zumindest unsere WordPress Version im Gegensatz zu Wikipedia kein  LaTeX-Logo kann, lässt sich der Mittelwert „x_quer“ nicht so ohne weiteres mit einem Balken über dem x abbilden …