środa, 13 czerwca 2007

Praca nad Tekami Dworzaczka

W mailowej dyskusji z p. Danielem Kamińskim o Tekach Dworzaczka pojawił się wątek, który warto upublicznić. Ostatnio pracowałem nad wyciągnięciem dodatkowych danych z Tek. Kiedy to robię, muszę mieć jakiś wzór, żeby je uchwycić.

Na przykład tak jak poprzednio:
a) wyszukanie brakujących teściów:

- z bazy wybieram wszystkie pary małżeńskie, gdzie żona nie ma ojca a oboje są wzmiankowani w GEDCOM-ie Tek Dworzaczka
- automatycznie przeglądam wszystkie Monografie wyszukując pary postaci "[Kowa*]*Zygm*Joan*Nież*cór", tzn.: w artykule o nazwisku na "Kowa*" wyszukuję ciągu pierwszych czterech liter imienia męża, potem pierwszych czterech liter imienia żony, pierwszych czterech liter nazwiska żony oraz słów zaczynająych się od "cór" - po to, żeby znaleźć przypadki postaci: "[Kowalscy:] Zygmunt, syn Jana i Rozalii Święcickiej, poślubił 1784 Joannę Nieżychowską, córkę Feliksa"
- potem całość wrzucam do Excela, odrzucam przypadki nie pasujące itd...
- efekt: ok. 2,5 tys. pań odnalazło swoich tatusiów

b) wyszukanie brakujących dzieci

- z bazy wyciągam wszystkie bezdzietne pary wzmiankowane w GEDCOM-ie Tek Dworzaczka
- w podobny sposób jak powyżej przeglądam automatycznie bazę metryk (pliki M1 do M9) w Tekach Dworzaczka, wyszukując wszystkie osoby, które pasują do wzorca

Brak komentarzy: