Donnerstag, 21. Februar 2019
Hase
So eine Vaterschaft ist ein verantwortungsvoller Aufgabe. Das fängt schon damit an, daß man (mit der Mutter) einen Namen finden muß. Als ich zufällig auf die Liste der häufigen Vornamen 2018 (Berlin) gestoßen bin, dachte ich mir, ein genauerer Blick lohnt sich. Da es dort auch die vollständigen Listen aller Namen im csv-Format gibt, lassen sich die weniger populären Namen finden.

Die Daten sind nach Bezirken getrennt, so daß sich eine Berlin-übergreifende Statistik nicht so einfach anfertigen ließ. Da python mit seinen Dictionries ein bequemes Werkzeug liefert, entschied ich mich dafür (strings sind ein Krampf in C). Außerdem gibt es ein fertiges Paket zum lesen der csv-Dateien. Folglich konnte ich die Daten in kurzer Zeit zusammenführen. "Diego" kommt z.B. 21x vor.

Da es in Berlin viele Namen mit "Migrationshintergrund" gibt, sind unter den seltenen auch viele ungewöhnliche bzw. gänzlich unbekannte. Ich entschied mich also eine Internetabfrage hinzuzufügen. Das ging einfach mit wget: "wget -q --spider https://en.wikipedia.org/wiki/"+n wobei n der Name ist um den es geht. Gibt es einen Eintrag, dann liefert die Funktion den Wert 0 zurück. In python geht das mit "os.system".