Το βιβλίο προσφέρει την εφαρμογή μιας ενοποιημένης στατιστικής μεθόδου για την επίλυση των προβλημάτων επεξεργασίας φυσικής γλώσσας, τα οποία ερμηνεύονται στη συντριπτική τους πλειοψηφία ως μια διαδικασία διαγωνισμού οντοτήτων. Τέτοια παραδείγματα έχουμε στην περίπτωση της αποσαφήνισης της έννοιας μιας λέξης, όπου ανταγωνιζόμενες έννοιες προσπαθούν να ταιριάσουν καλύτερα στα συμφραζόμενα μιας πρότασης. Στην εισαγωγή παρουσιάζονται τα στατιστικά μοντέλα που χρησιμοποιούνται στην επεξεργασία φυσικής γλώσσας. Στη συνέχεια αναπτύσσεται ένα πλαίσιο αναζήτησης εγγράφων, το οποίο είναι χρήσιμο στην αναζήτηση πληροφορίας από το internet, παρουσιάζονται μέθοδοι εύρεσης συνεκφερόμενων λέξεων και αποσαφηνίζεται η έννοια μιας λέξης. Τέλος παρουσιάζονται τα αποτελέσματα αποτίμησης αυτών των μεθόδων, οι οποίες είναι χρήσιμες στην έρευνα και στην εκπαίδευση.