dyscokolwiek

Wiele osób (zwłaszcza przed maturą) załatwia sobie licencje zwalniające z obowiązku posiadania popularnych dla każdego umiejętności. Taka np. dysortografia, spójrzmy jak definiuje ją Wikipedia:

Dysortografiazaburzenie psychiczne, objawiające się na nieświadomym popełnianiu błędów ortograficznych pomimo znajomości zasad pisowni i odpowiedniej motywacji do poprawnego pisania. Dysortografia może być korygowana poprzez nauczenie zasad ortografii jednak całkowite ustąpienie objawów występuje bardzo rzadko. Równie powszechnie wyolbrzymia się lenistwo i nieuwagę dziecka.

Szczególnie interesujące jest ostatnie zdanie, ale abstrahując od niego to ciekawi mnie jak bada się taką „nieświadomość”. Przecież to może być zwyczajny brak koncentracji, lenistwo itp. No ale skoro ludzie dostają jakieś zaświadczenia, z których pewnie wiele jest mocno naciągniętych to jednak musi mieć to jakiś związek z chorobą. No zaraz, czy to nie jest tak, że chorobę się leczy? Hmm.. chyba nie zawsze, leczy się wtedy gdy ona przeszkadza. Choremu. Nie otoczeniu (pomijając te zakaźne). Chory jednak nie przejmuje się tym, no bo ma licencję na chorobę, która go nie boli. Papierek może pozwala mu robić błędy w szkole. Ale co jeśli ma dostęp do internetu, słownika? Napisze podanie o pracę z błędem i potem będzie się tłumaczył, że ma papierek od lekarza? Ja mam gdzieś takie tłumaczenie. Jeśli komuś na czymś zależy to powinien się bardziej postarać. Wygląda na to, że ta druga strona również ma to gdzieś. Co gorsza, często nie chodzi tutaj o chorobę, ale zwykłą nieznajomość. Wystarczy popatrzeć na sieć.

Pomyślałem, że takie coś możnaby „leczyć” automatycznie, korzystając z wyszukiwarki Google. Weźmy słowo napisane poprawnie oraz jego odpowiednik z błędem ortograficznym. Dla przykładu żeby i rzeby. Teraz wyszukujemy stron z nimi związanych. Mamy 104 mln wyników dla żeby oraz 167 tys. dla rzeby. Błąd stanowi więc około 0,2% zawartości wszystkich stron zawierających (ż|rz)eby. To niby niewiele, w dodatku możnaby pomyśleć, że jakie błędy takie strony… No ale teraz zróbmy ten sam test dla słów diakrytyczne i diaktryczne. Wynik: ~54 tys. poprawnych, ~7.5 tys. błędnych. Błąd rzędu 12%, a więc „nieco” większy… Co dziwniejsze, myślę że niektóre ze stron www zawierających diaktryczne reprezentują całkiem niezły poziom.

Teraz tylko przydałby się bot, najlepiej z certyfikatem Ministerstwa Edukacji, który przeszukiwałby sieć zaczynając od słów z największym procentem błędu (opisanym powyżej). Bot taki próbowałby kontaktować się ze stronami zawierającymi błędy np. poprzez e-mail, prosząc o ich poprawienie. Następnie obserwowałby czy coś się zmieniło, na lepsze oczywiście. Na tej podstawie analizowałby czy jego działalność ma sens, czy dalej ją kontynuowąć, dla jakich stron itp. Kto wie, może siła autorytetu takiego bota (rządowego) wystarczyłaby aby przekonać właścicieli stron do podnoszenia prestiżu.