środa, 13 czerwca 2007

Praca nad Tekami Dworzaczka

W mailowej dyskusji z p. Danielem Kamińskim o Tekach Dworzaczka pojawił się wątek, który warto upublicznić. Ostatnio pracowałem nad wyciągnięciem dodatkowych danych z Tek. Kiedy to robię, muszę mieć jakiś wzór, żeby je uchwycić.

Na przykład tak jak poprzednio:
a) wyszukanie brakujących teściów:

- z bazy wybieram wszystkie pary małżeńskie, gdzie żona nie ma ojca a oboje są wzmiankowani w GEDCOM-ie Tek Dworzaczka
- automatycznie przeglądam wszystkie Monografie wyszukując pary postaci "[Kowa*]*Zygm*Joan*Nież*cór", tzn.: w artykule o nazwisku na "Kowa*" wyszukuję ciągu pierwszych czterech liter imienia męża, potem pierwszych czterech liter imienia żony, pierwszych czterech liter nazwiska żony oraz słów zaczynająych się od "cór" - po to, żeby znaleźć przypadki postaci: "[Kowalscy:] Zygmunt, syn Jana i Rozalii Święcickiej, poślubił 1784 Joannę Nieżychowską, córkę Feliksa"
- potem całość wrzucam do Excela, odrzucam przypadki nie pasujące itd...
- efekt: ok. 2,5 tys. pań odnalazło swoich tatusiów

b) wyszukanie brakujących dzieci

- z bazy wyciągam wszystkie bezdzietne pary wzmiankowane w GEDCOM-ie Tek Dworzaczka
- w podobny sposób jak powyżej przeglądam automatycznie bazę metryk (pliki M1 do M9) w Tekach Dworzaczka, wyszukując wszystkie osoby, które pasują do wzorca

wtorek, 12 czerwca 2007

40 osób na tydzień

W bazie www.sejmwielki.pl w ostatniej wersji (z 4 VI) było 48438 osób, teraz wrzucam wersję, w której jest 280 osób więcej.

"W życia wędrówce, na połowie czasu"

W życia wędrówce, na połowie czasu,
Straciwszy z oczu szlak niemylnej drogi,
W głębi ciemnego znalazłem się lasu.

Co mam na myśli? Ha, jutro 13 VI 2007...

Search Engine Marketing (& Search Engine Land) Not Notable For Wikipedia?

Czytam właśnie w SearchEngineLand: Search Engine Marketing (& Search Engine Land) Not Notable For Wikipedia? I zastanawiam się, czy słusznie umieszczam w obu bazach tagi "Bohater wikipedii". Bo o ile "Bohater PSB" (osoba, która ma artykuł w Polskim Słowniku Biograficznym) musiała sobie na to obiektywnie zasłużyć, to co do Wikipedii nabieram coraz więcej wątpliwości.

Zagubieni teściowie z Dworzaczka

Mieliśmy tydzień z długim weekendem (Boże Ciało i wolny piątek). Miałem nadzieję że zrobię dużo, ale usiadłem nad Tekami Dworzaczka i w nie wsiąkłem. Wspominał mi kiedyś prof. Wisłocki, że gdy opracowywali Teki, to do GEDCOM-u nie weszły informacje o rodzicach małżonek przedstawicieli opisywanych rodzin.

Siadłem zatem i zapuściłem automatyczne wyszukiwanie dla wszystkich małżeństw, które są wzmiankowane w GEDCOM-ie Tek, a ojciec żony jest nieznany. Wynalazłem ich w sumie ponad 2,5 tysiąca. W sumie jak na ok. 60 tys. osób w tej bazie to niezła liczba. Część z nich weszła do Potomków Sejmu Wlk., ale większość będzie tylko w Tych wielkich Polakach (w wydaniu 2008).