Subpage under development, new version coming soon!
Subject: Jouw naam als speler?
Ik ben er even snel doorheen gegaan, maar alle achternamen met een â, û of ê zijn Friese plaatsnamen. Ik kan me er nog wat bij voorstellen dat die in het lijstje met tweede deel van teamnamen voorkomen zodat je (dubieuze) namen als Voetbalvereniging Feanwâlden kunt krijgen (al is dat overigens niet toegestaan, maar gezien het feit dat Nederland voorlopig toch niet uitgebreid wordt zal mij dat een zorg zijn), maar als achternaam is het vaak belachelijk omdat ten tijde van Napoleon de Friese orthografie er anders uitzag en deze karakters niet eens gebruikt werden en in veel gevallen is de Nederlandse naam van Friese plaatsen de oude Friese naam voor die plaats. Verder ben ik nog Damwâld tegengekomen dat pas onststaan is toen mijn vader twintiger was. Voor iedereen die uit Friesland komt is dit belachelijk (en waarschijnlijk ook voor mensen uit andere provincies).
Verder staan er nog andere Friese plaatsnamen in die wat minder gemakkelijk te vinden zijn omdat zij niet dergelijke tekens bevatten, maar een enkeling daarvan lijkt mij ook daadwerkelijk als achternaam voor te komen. Dit is erg jammer omdat er wel degelijk genoeg Friese achternamen zijn die niet in de databank voorkomen.
En dit geeft mij te denken, als er zoveel Friese plaatsnamen toegevoegd zijn, is dit dan ook voor andere provincies gedaan?
En nu snap ik heel goed dat de situatie in het verleden niet goed was, dat je soms spelers met dezelfde naam in je jeugdopleiding tegen kwam (al is dit niet extreem bijzonder als je bedenkt dat een club zijn talenten uit de regio haalt en er in het Nederlands elftal zelfs twee de Boers tegelijk speelden), maar dat wil niet zeggen dat er 32 miljoen combinaties mogelijk moeten zijn. Zoals het er nu naar uitziet ben je echt te ver doorgeschoten.
Wat ik gedaan heb is de voornamenlijst in groepen van 200 verdeeld en de achternamenlijst in groepen van 400. Als iemand dan zin heeft kijkt hij een hele groep door en zet achter de naam iets neer als er wat mee is (bijvoorbeeld bestaat niet, verbastering, variatie of buitenlands). Dan kunnen we de lijst makkelijk categoriseren. Ik denk dat er online ook wel lijsten van 100 meest-voorkomende namen of die van voetballers zijn. Als we die er uithalen kunnen we aparte lijsten maken en namen eruit halen. Dan zijn we dan al een stuk dichter bij het maken van een zinnige databank.
Verder staan er nog andere Friese plaatsnamen in die wat minder gemakkelijk te vinden zijn omdat zij niet dergelijke tekens bevatten, maar een enkeling daarvan lijkt mij ook daadwerkelijk als achternaam voor te komen. Dit is erg jammer omdat er wel degelijk genoeg Friese achternamen zijn die niet in de databank voorkomen.
En dit geeft mij te denken, als er zoveel Friese plaatsnamen toegevoegd zijn, is dit dan ook voor andere provincies gedaan?
En nu snap ik heel goed dat de situatie in het verleden niet goed was, dat je soms spelers met dezelfde naam in je jeugdopleiding tegen kwam (al is dit niet extreem bijzonder als je bedenkt dat een club zijn talenten uit de regio haalt en er in het Nederlands elftal zelfs twee de Boers tegelijk speelden), maar dat wil niet zeggen dat er 32 miljoen combinaties mogelijk moeten zijn. Zoals het er nu naar uitziet ben je echt te ver doorgeschoten.
Wat ik gedaan heb is de voornamenlijst in groepen van 200 verdeeld en de achternamenlijst in groepen van 400. Als iemand dan zin heeft kijkt hij een hele groep door en zet achter de naam iets neer als er wat mee is (bijvoorbeeld bestaat niet, verbastering, variatie of buitenlands). Dan kunnen we de lijst makkelijk categoriseren. Ik denk dat er online ook wel lijsten van 100 meest-voorkomende namen of die van voetballers zijn. Als we die er uithalen kunnen we aparte lijsten maken en namen eruit halen. Dan zijn we dan al een stuk dichter bij het maken van een zinnige databank.
Ik heb hier het excel-bestand. Ik heb een aantal gedaan als voorbeeld. Iedereen die zin heeft om een aantal namen te doen kan het bestand downloaden en dan aanpassingen doen. Zet bovenaan de kolom je gebruikersnaam. Probeer een hele kolom in één keer te doen, maar als dat niet lukt is dit niet erg. Zet wel voordat je begint in dit topic welke kolom je gaat doen. Het zou heel erg zonde zijn als twee mensen tegelijkertijd dezelfde kolom zouden doen.
Excel-bestand: https://www.dropbox.com/s/hzsbacs9mqkgg4f/namen.xlsx?dl=0
Hier kun je zien hoe vaak een achternaam in een bepaalde gemeente voorkomt en wat de betekenis is: http://www.meertens.knaw.nl/nfb/
Ik ga nu aan de hand van dit topic een lijst samenstellen met alle namen van Sokker gebruikers. Deze namen zullen dan sowieso een grotere kans krijgen om voor te komen.
Excel-bestand: https://www.dropbox.com/s/hzsbacs9mqkgg4f/namen.xlsx?dl=0
Hier kun je zien hoe vaak een achternaam in een bepaalde gemeente voorkomt en wat de betekenis is: http://www.meertens.knaw.nl/nfb/
Ik ga nu aan de hand van dit topic een lijst samenstellen met alle namen van Sokker gebruikers. Deze namen zullen dan sowieso een grotere kans krijgen om voor te komen.
Ik heb alle namen die in dit topic aangevoerd zijn op een rijtje gezet. Deze doe ik in een apart bestand.
Wacht nog maar even. Ik ben alle sokker gebruikers en bekende voetballers uit de lijst aan het halen. Die doe ik in een andere lijst.
Vanaf hier is te lezen hoe er begonnen is met het aanvullen van de namenlijsten:
http://sokker.org/forum_topic/ID_forum/1276/ID_topic/101486/pg/84#forum-topic-post-1252
EDIT: bijvoorbeeld dit
http://nl.wikipedia.org/wiki/Lijst_van_spelers_van_het_Nederlands_voetbalelftal
http://nl.wikipedia.org/wiki/Lijst_van_Nederlandse_voetballers
http://www.stamboomsurfpagina.nl/familienamen.html
http://www.voornamen.com/jongens.php
http://www.transfermarkt.nl/ (voor alle spelers uit de eredivisie en eerste divisie)
(edited)
http://sokker.org/forum_topic/ID_forum/1276/ID_topic/101486/pg/84#forum-topic-post-1252
EDIT: bijvoorbeeld dit
http://nl.wikipedia.org/wiki/Lijst_van_spelers_van_het_Nederlands_voetbalelftal
http://nl.wikipedia.org/wiki/Lijst_van_Nederlandse_voetballers
http://www.stamboomsurfpagina.nl/familienamen.html
http://www.voornamen.com/jongens.php
http://www.transfermarkt.nl/ (voor alle spelers uit de eredivisie en eerste divisie)
(edited)
Dat had ik al gezien.
Kun jij mij uitleggen waarom er een hele berg plaatsnamen inzit?
Stel er zitten 4000 (de helft) plaatsnamen in de database. Als we die er allemaal uithalen blijven er nog altijd 16 miljoen combinaties over. Het gevolg daarvan is dan wel dat een grote deel van de gekke namen (bijvoorbeel Damwâld of Feanwâlden) verdwijnt. Het is belangrijk dat de database groot genoeg is en dat niet teveel dubbele namen voorkomen, maar naar mijn idee is dat op dit moment geen issue.
Stel dat we 1000 unieke namen per team rekenen. Dan zijn er 682.000 mogelijke combinaties nodig. Op dit moment zijn het er 50 keer zoveel. Als we alle gekke namen eruit halen en we blijven nog ruim boven dit getal, dan moeten we dat naar mijn idee vooral doen.
Een goed systeem moet, naar mijn mening, de volgende doelen hebben:
- Niet teveel dubbele naam (dit doel is ruimschoots gehaald)
- Namen van bekende voetballers (en eventueel ook andere BN'ers) komen vaker voor (wordt nu gedaan door middel van dubieuze verbasteringen en toevoegingen)
- Namen van Sokker-gebruikers komen vaker voor
- Vaak-voorkomende Nederlandse namen komen vaker (wordt nu gedaan door variaties en samengestelde namen te gebruiken)
- Namen vormen logischere combinaties (bijv. Ugur Yildirim, Foeke Booy of Frank de Boer)
Kun jij mij uitleggen waarom er een hele berg plaatsnamen inzit?
Stel er zitten 4000 (de helft) plaatsnamen in de database. Als we die er allemaal uithalen blijven er nog altijd 16 miljoen combinaties over. Het gevolg daarvan is dan wel dat een grote deel van de gekke namen (bijvoorbeel Damwâld of Feanwâlden) verdwijnt. Het is belangrijk dat de database groot genoeg is en dat niet teveel dubbele namen voorkomen, maar naar mijn idee is dat op dit moment geen issue.
Stel dat we 1000 unieke namen per team rekenen. Dan zijn er 682.000 mogelijke combinaties nodig. Op dit moment zijn het er 50 keer zoveel. Als we alle gekke namen eruit halen en we blijven nog ruim boven dit getal, dan moeten we dat naar mijn idee vooral doen.
Een goed systeem moet, naar mijn mening, de volgende doelen hebben:
- Niet teveel dubbele naam (dit doel is ruimschoots gehaald)
- Namen van bekende voetballers (en eventueel ook andere BN'ers) komen vaker voor (wordt nu gedaan door middel van dubieuze verbasteringen en toevoegingen)
- Namen van Sokker-gebruikers komen vaker voor
- Vaak-voorkomende Nederlandse namen komen vaker (wordt nu gedaan door variaties en samengestelde namen te gebruiken)
- Namen vormen logischere combinaties (bijv. Ugur Yildirim, Foeke Booy of Frank de Boer)
Ik heb een aantal lijstjes gemaakt en die eruit gefilterd.
-Voornamen in de databank: 3536
-Achternamen in de databank: 9077
Ik heb de volgende lijstjes gemaakt (de namen in deze lijstjes staan niet allemaal in de databank, namen kunnen op meerdere lijstjes voorkomen):
- Plaatsnamen: 2422
- Namen met â, ê en û die niet in plaatsnamen staan (meeste zijn wel plaatsnamen): 22
- Achternamen met Junior: 76
- Achternamen ooit in Nederlands elftal gespeeld: 677
- Voornamen ooit in Nederlands elftal gespeeld: 322
- Populaire achternamen: 115
- Populaire voornamen: 104
- Achternamen Sokker-users: 229
- Voornamen Sokker-users: 168
- Achternamen Nederlandse voetballers: 1001
- Voornamen Nederlandse voetballers: 503
De namen die in deze lijstsjes staan heb ik uit het lijstje met namen in de databank gehaald (n.b. ik de databank zelf niet aangepast). Dan blijft het volgende over:
- Overige achternamen:
- Overige achternamen: 6991 (hier staan nog een groot aantal plaatsnamen in)
- Overige voornamen: 2949
Dus als wij alle plaatsnamen eruit zouden halen, blijven er sowieso nog 21 miljoen combinaties over. Natuurlijk zijn er plaatsnamen die ook werkelijk als achternaam gebruikt worden en er staan nog plaatsnamen in de lijst met namen, maar misschien heeft iemand zin om dit uit te zoeken.
De verbasteringen heb ik er niet uitgefilterd omdat dat moeilijk handmatig kan.
Conclusie is dus dat er genoeg combinaties overblijven als we de plaatsnamen (die verantwoordelijk zijn voor een groot deel van de onrealistische namen) eruit gooien. Ik zie dan ook geen goeie reden om dit niet te doen.
Wie geïnteresseerd is in mijn werk kan het volgende ZIP-bestand downloaden: https://www.dropbox.com/s/iv8twtagpta1ntu/Categorie%C3%ABn.zip?dl=0
(edited)
-Voornamen in de databank: 3536
-Achternamen in de databank: 9077
Ik heb de volgende lijstjes gemaakt (de namen in deze lijstjes staan niet allemaal in de databank, namen kunnen op meerdere lijstjes voorkomen):
- Plaatsnamen: 2422
- Namen met â, ê en û die niet in plaatsnamen staan (meeste zijn wel plaatsnamen): 22
- Achternamen met Junior: 76
- Achternamen ooit in Nederlands elftal gespeeld: 677
- Voornamen ooit in Nederlands elftal gespeeld: 322
- Populaire achternamen: 115
- Populaire voornamen: 104
- Achternamen Sokker-users: 229
- Voornamen Sokker-users: 168
- Achternamen Nederlandse voetballers: 1001
- Voornamen Nederlandse voetballers: 503
De namen die in deze lijstsjes staan heb ik uit het lijstje met namen in de databank gehaald (n.b. ik de databank zelf niet aangepast). Dan blijft het volgende over:
- Overige achternamen:
- Overige achternamen: 6991 (hier staan nog een groot aantal plaatsnamen in)
- Overige voornamen: 2949
Dus als wij alle plaatsnamen eruit zouden halen, blijven er sowieso nog 21 miljoen combinaties over. Natuurlijk zijn er plaatsnamen die ook werkelijk als achternaam gebruikt worden en er staan nog plaatsnamen in de lijst met namen, maar misschien heeft iemand zin om dit uit te zoeken.
De verbasteringen heb ik er niet uitgefilterd omdat dat moeilijk handmatig kan.
Conclusie is dus dat er genoeg combinaties overblijven als we de plaatsnamen (die verantwoordelijk zijn voor een groot deel van de onrealistische namen) eruit gooien. Ik zie dan ook geen goeie reden om dit niet te doen.
Wie geïnteresseerd is in mijn werk kan het volgende ZIP-bestand downloaden: https://www.dropbox.com/s/iv8twtagpta1ntu/Categorie%C3%ABn.zip?dl=0
(edited)
Ik zal er van de week eens naar kijken als ik tijd heb.
Wil jij jouw naam in de Sokker database hebben staan? Dan kan je die nu opgeven.
En gelijk een familielid van je binnen:
Ludo Korteschiel 16 hopeless [1] outfield 10
Ludo Korteschiel 16 hopeless [1] outfield 10
Vreemd, eigenlijk zou ie dan niet hopeloos moeten zijn..
:D
:D
Kick Krajicek [34577538]
Prachtige naam !
Zit de naam Krajicek nog in de database ?
Geen idee, maar nu dit topic ineens weer bovenaan staat: Ik heb eindelijk een jeugdspeler met mijn achternaam :D
Tobin Houtekamer 17 adequate [6] outfield 13 (+1) 18
Tobin Houtekamer 17 adequate [6] outfield 13 (+1) 18