Argumentowaliśmy wcześniej, że semantyka bazy danych jest odpowiednia w sytuacjach, w których dokładnie znamy zbiór odpowiednich obiektów, które istnieją i możemy je jednoznacznie zidentyfikować. (W szczególności wszystkie obserwacje dotyczące obiektu są poprawnie powiązane ze stałym symbolem, który go nazywa.) Jednak w wielu rzeczywistych warunkach takie założenia są po prostu nie do utrzymania. Na przykład sprzedawca książek może użyć numeru ISBN (International Standard Book Number) jako stałego symbolu nazwy każdej książki, nawet jeśli dana „logiczna” książka (np. „Przeminęło z wiatrem”) może mieć kilka numerów ISBN odpowiadających twardej oprawie , miękka, dużym drukiem, wznowienia i tak dalej. Rozsądne byłoby zbieranie rekomendacji dla wielu numerów ISBN, ale sprzedawca może nie wiedzieć na pewno, które numery ISBN są naprawdę tą samą książką. (Zauważ, że nie potwierdzamy poszczególnych egzemplarzy książki, które mogą być niezbędne do sprzedaży używanych książek, sprzedaży samochodów itd.) Co gorsza, każdy klient jest identyfikowany za pomocą identyfikatora logowania, ale klient nieuczciwy może mieć tysiące identyfikatorów! W dziedzinie bezpieczeństwa komputerowego te liczne identyfikatory nazywane są sybils, a ich użycie do zmylenia systemu reputacji nazywa się atakiem sybil. Tak więc nawet prosta aplikacja w stosunkowo dobrze zdefiniowanej domenie online wiąże się zarówno z niepewnością istnienia (jakie są prawdziwe księgi i klienci leżący u podstaw obserwowanych danych), jak i niepewnością tożsamości (które terminy logiczne rzeczywiście odnoszą się do tego samego obiektu). Zjawiska istnienia i niepewności tożsamości wykraczają daleko poza księgarnie internetowe. W rzeczywistości są wszechobecne:
- System wizyjny nie wie, co istnieje, jeśli w ogóle, za następnym rogiem i może nie wiedzieć, czy obiekt, który widzi teraz, jest tym samym, który widział kilka minut temu.
- System rozumienia tekstu nie zna z góry jednostek, które zostaną przedstawione w tekście i musi uzasadnić, czy wyrażenia takie jak „Mary”, „Dr. Smith, „ona”, „jego kardiolog”, „jego matka” itd. odnoszą się do tego samego obiektu.
- Analityk wywiadu polujący na szpiegów nigdy nie wie, ilu naprawdę jest szpiegów, i może tylko zgadywać, czy różne pseudonimy, numery telefonów i obserwacje należą do tej samej osoby.
Rzeczywiście, znaczna część ludzkiego poznania wydaje się wymagać poznania, jakie obiekty istnieją i umiejętności łączenia obserwacji — które prawie nigdy nie mają dołączonych unikalnych identyfikatorów — z hipotetycznymi obiektami na świecie. Dlatego musimy być w stanie zdefiniować model prawdopodobieństwa otwartego wszechświata (OUPM) oparty na standardowej semantyce logiki pierwszego rzędu. Język jednostek OUPM umożliwia łatwe pisanie takich modeli, gwarantując jednocześnie unikalny, spójny rozkład prawdopodobieństwa w nieskończonej przestrzeni możliwych światów.