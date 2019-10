Imigranci w pułapce komputerowych tłumaczeń 0 7 października 2019

Los imigrantów może zależeć od komputerowych algorytmów, a dokładnie od dokładności serwisów tłumaczeniowych, takich jak Google Translate. Urzędnicy federalni otrzymali bowiem instrukcje, aby sprawdzać wpisy potencjalnych imigrantów w mediach społecznościowych za pomocą maszynowych tłumaczeń.

Nie dość, że służby imigracyjne sprawdzą nasze media społecznościowe, to jeszcze istnieje duże prawdopodobieństwo, że wpisy zostaną błędnie przetłumaczone.

Google Translate krok po kroku

Sprawę ujawnił nie nastawiony na zysk nowojorski portal ProPublica, specjalizujący się w reportażu śledczym. Dziennikarze, za pośrednictwem organizacji International Refugee Assistance Project, dotarli do wewnętrznych instrukcji U.S. Citizenship and Immigration Services dotyczących procedury sprawdzania przeszłości osób m.in. ubiegających się o azyl w USA. Znaleźć w niej można dokładne wskazówki, w jaki sposób należy podchodzić do tłumaczenia nieangielskojęzycznych wpisów w mediach społecznościowych. Autorzy instrukcji bezkrytycznie tłumaczą, jak skorzystać z pomocy internetowych translatorów. ,,Najskuteczniejszym podejściem do tłumaczenia treści w obcym języku jest skorzystanie z jednej z wielu bezpłatnych usług tłumaczeniowych oferowanych m.in. przez Google, Yahoo, Bing i inne wyszukiwarki” – można przeczytać w dokumencie. Po czym następują szczegółowe instrukcje, jak krok po kroku korzystać z Google Translate.

Wpisy pod lupą

Ujawniony dokument dotyczy procedur związanych z azylantami. Jak jednak wiadomo, od niedawna nawet we wnioskach o wizy turystyczne do USA znalazły się rubryki, w których należy podać dane umożliwiające dostęp do mediów społecznościowych wnioskodawcy. W formularzach należy podać takie informacje jak: adresy e-mail, numery telefonów z ostatnich pięciu lat — oraz namiary na konta w serwisach społecznościowych. Niewykluczone więc, że za pomocą usług tłumaczeniowych sprawdza się także podania innych osób udających się do USA. Pozwala na to prezydenckie rozporządzenie wykonawcze z 2017 roku, mające na celu powstrzymanie napływu terrorystów do USA. Trzeba jednak uczciwie przyznać, że pomysł kontroli mediów społecznościowych osób zamierzających przyjechać do Stanów pojawił się jeszcze za czasów prezydentury Baracka Obamy. W 2016 roku powołano w tym celu specjalny oddział w ramach USCIS, a programy pilotażowe zaczęły się rok wcześniej. Już wówczas należało się spodziewać, że służby federalne nie znajdą wystarczającej liczby osób znających języki obce do sprawdzania wpisów.

NMT nie wystarczy

Tłumaczenia z darmowych narzędzi translacyjnych są jednak mocno niedoskonałe, mimo nieustannych wysiłków takich spółek jak Google, Microsoft, czy Verizon (właściciel Yahoo). Do ciągłego doskonalenia jakości tłumaczeń zaprzężono nawet sztuczną inteligencję. Google Translate zaczął trzy lata temu odchodzić od tłumaczenia i rozumienia syntetycznego, co w praktyce sprowadzało się do przekładania zdań słowo po słowie. W sytuacji, gdy spotykały się ze sobą dwa języki oparte na zupełnie odmiennej strukturze, takich jak pozycyjny angielski i fleksyjny polski, dochodziło do absurdów, przypominającej zabawę w głuchy telefon. Teraz w wielu przypadkach Google wykorzystuje technologię Neural Machine Translation (NMT), co przekłada się w praktyce na tłumaczenie zdania jako jednej całości. Wykorzystuje się w tym celu sztuczną sieć neuronową, która symuluje sposób, w jaki ludzki mózg podchodzi do percepcji języka. Ten system to faktycznie ogromny skok w przód, ale nie daje żadnej gwarancji precyzyjnego tłumaczenia. Badania naukowców z Holandii dowiodły, że NMT kiepsko sobie radzi na przykład z idiomami. Poza tym NMT wspiera kilkadziesiąt języków (w tym polski), ale nie wszystkie. Nawet przy użyciu nowej technologii elektroniczny tłumacz o wiele dokładniej przekłada zadane mu teksty, ale gubi się w przypadku, gdy wchodzi w grę specyficzny kontekst wyrażeń, nieformalny styl, slang, czy skrót myślowy. Nic więc dziwnego, że mimo osiągniętych postępów Google informuje użytkowników, iż ich serwis nie może zastąpić żywych tłumaczy.

11 tysięcy kontroli

Wśród polskich internautów szerokim echem odbiła się historia z maja ubiegłego roku, gdy tłumacz Google tłumaczył hasło ,,Mieszkam na zadupiu” na ,,I live in the city of Krakow” (Mieszkam w Krakowie). Podobnie było w przypadku innych języków – wynik był zawsze taki sam. Początkowo myślano, że to fejk, potem, iż to żart programistów. Okazało się jednak, że to błąd, za który przeprosili twórcy oprogramowania. ,,Tłumaczenie maszynowe jest złożonym wyzwaniem technicznym i czasami popełniamy błędy. Kiedy dowiadujemy się o problemie, staramy się go poprawić tak szybko, jak to jest możliwe. Przepraszamy wszystkich, którzy poczuli się urażeni tym tłumaczeniem” – pokajało się wówczas biuro prasowe polskiego oddziału Google.

Przypadek może i zabawny (choć na pewno nie dla krakusów), ale osobom starającym się o pozostanie w USA może nie być do śmiechu. W 2018 roku USCIS przyznało się do 11740 kontroli mediów społecznościowych. Agencja federalna przyznała, że tylko okazjonalnie zdarza się, iż wynik tłumaczenia może okazać się niezrozumiały, głównie z powodu użycia wyrażeń potocznych, lub dialektu. W takich przypadkach urzędnicy mogą się wesprzeć profesjonalnym tłumaczeniem – tłumaczy USCIS.

Bez poczucia humoru

Jak to wygląda w praktyce? Facebook musiał już przepraszać za błędne tłumaczenie, które doprowadziło do zatrzymania Palestyńczyka, gdy w miejsce arabskiego ,,Dzień dobry” pojawiło się tłumaczenie ,,Skrzywdź ich” (Hurt them). Aby udowodnić, jak zawodnym narzędziem może być serwis tłumaczeniowy, ProPublica posłużyła się eksperymentem, zlecając kilku lingwistom przekopiowanie do Google Translate nieangielskojęzycznych tweetów napisanych potocznym językiem, prosząc jednocześnie o ocenę rezultatów. W jednym przypadku wpis w języku urdu: ,,Byłem wielokrotnie karcony fizycznie, ale także doświadczyłem wiele miłości” maszyna przetłumaczyła na ,,Bicie jest zbyt duże, a miłość zbyt wietrzna” (Beating is too big and the love is too windy).

,,To absolutnie niewłaściwa technologia dla urzędników imigracyjnych podejmujących ważne decyzje” – uważa Sheida Dayani, lektorka języka perskiego na Harvard University. Sama też nie toleruje korzystania z tego narzędzia przez swoich studentów. Eksperci zwracają też uwagę, że usługi tłumaczeniowe nie dają sobie rady z wpisami satyrycznymi, ironią, czy sarkazmem. Krótko mówiąc – nie mają poczucia humoru. Poza tym języki, zwłaszcza używane przez młodych ludzi, ewoluują tak szybko, że algorytmy za nimi nie nadążają.

Tymczasem rzeczniczka USCIS Jessica Collins w odpowiedzi przesłanej ProPublica określiła praktykę korzystania z komputerowych tłumaczeń jako ,,zdroworozsądkową metodę wzmocnienia procedur kontrolnych”. Trudno jednak uznać za przejaw zdrowego rozsądku korzystanie z technologii, z której nie powinny korzystać nawet nasze dzieci przy nauce języka obcego i odrabianiu pracy domowej.

Jolanta Telega

j.telega@zwiazkowy.com

fot.ICE.gov