DeepL: startup z Kolonii prześciga Google Translate

image

Niemiecki startup tłumaczeniowy zaskakuje wielu użytkowników tym, jak dobrze tłumaczy teksty. Teraz oferuje dwa kolejne języki: rosyjski i portugalski. Co sprawia, że DeepL jest lepszy od Google Translate?

Startup z Kolonii, DeepL, został założony przez byłego pracownika Google. Oferuje narzędzie do tłumaczenia, które tworzy bardziej naturalnie sformułowany tekst niż którykolwiek z jego dużych konkurentów.

Usługa wykorzystuje tzw. technologię deep learning opartą na sztucznych sieciach neuronowych. Ale jak to dokładnie działa?

Od słownika do tłumacza

Zanim firma uruchomiła nowe narzędzie do tłumaczenia w sierpniu 2017 roku, była w "biznesie językowym" już od dłuższego czasu. W 2009 roku uruchomili słownik o nazwie Linguee. Co było w nim wyjątkowego? Oprócz różnych opcji tłumaczenia, oferował próbki już przetłumaczonych fragmentów tekstu w wybranych parach językowych. 

Próbki te były zbierane z Internetu za pomocą specjalnych botów internetowych, które pomagają w indeksowaniu stron internetowych, zwanych web crawlerami. Wiele próbek tekstu pochodziło z dokumentów instytucji wielostronnych, takich jak Unia Europejska (UE).

Wyszkolony przez człowieka algorytm uczenia maszynowego oblicza następnie strukturę i znaczenie zebranego tekstu i uczy się, jak pewne idee są wyrażane w innym języku. Co więcej, użytkownicy mogą zostawiać opinie i oceniać tłumaczenia ręcznie. Przez dziewięć lat Linguee.com rozwijał się, internalizując coraz większą liczbę wysokiej jakości tłumaczeń. W ten sposób stał się bazą dla nowego narzędzia tłumaczeniowego.

DeepL oznacza "głębokie uczenie".

Deep learning to aspekt sztucznej inteligencji (AI), który chce odwzorować ludzkie uczenie się. W przeszłości programiści pisali indywidualne polecenia do każdego zadania, jakie miał do wykonania komputer. Teraz konstruują sztuczną sieć neuronową, która może być trenowana poprzez pokazywanie komputerowi istniejących przykładów. Im więcej przykładów, tym lepiej komputer może się uczyć. Big data jeszcze bardziej zwiększyła te możliwości uczenia maszynowego.

Od strony technologicznej, głębokie uczenie jest algorytmem, który wykorzystuje wiele warstw przetwarzania informacji. "Głębokie" odnosi się do liczby warstw, przez które dane są przekształcane. Dziś technologia ta obsługuje samojeżdżące samochody, zestawy słuchawkowe wirtualnej rzeczywistości i oprogramowanie do rozpoznawania twarzy. A teraz pomaga nam również w tłumaczeniach.

To więcej niż tylko głębokie uczenie

Tłumacz DeepL nie jest jedyną firmą, która w ciągu ostatnich dwóch lat korzystała z technologii deep learning. Korzystają z niej również tacy giganci internetowi jak Google, Microsoft i Yandex. Ale co wyróżnia DeepL?

Po pierwsze, wydajność sieci neuronowej opiera się na jakości materiału wejściowego użytego do treningu. I tu do gry wchodzi "wielki brat" Linguee, który dostarczył miliardy wysokiej jakości próbek tłumaczeń.

"Dane z Linguee to bardzo wysokiej jakości materiał szkoleniowy" - powiedział rzecznik firmy Lee Turner Kodak.

Nie tylko jakość danych sprawiła, że DeepL było możliwe.

"Nasi naukowcy są dobrze zorientowani w najnowszych osiągnięciach w tej dziedzinie i stworzyli unikalną architekturę sieci neuronowej" - podkreśla.

Dokładny sposób, w jaki technologia została połączona, pozostaje jednak tajemnicą. Nie chce stracić swojej przewagi rynkowej.

Więcej o nowinkach technologicznych przecztasz na https://spokeo.pl/tech

uczenie maszynowe

Trzy razy wydajniejszy niż Google Translate

Aby kontrolować jakość tłumaczeń, DeepL przeprowadza regularne ślepe testy, dzięki którym program utrzymuje wysokie standardy. Firma popiera swoje twierdzenie o byciu "najlepszą maszyną tłumaczącą na świecie" wynikami ślepego testu z sierpnia 2017 roku, opublikowanymi na swojej stronie internetowej. W ślepym teście porównano wyniki DeepL z wynikami tłumaczy przez ich rywali: Google, Microsoft i Facebook.

Maszyny otrzymały 100 zdań do przetłumaczenia z angielskiego na niemiecki, francuski i hiszpański oraz z tych trzech języków na angielski. Po eksperymencie profesjonalni tłumacze oglądali wyprodukowane teksty i oceniali jakość tłumaczenia. Strona DeepL była wybierana trzy razy częściej niż Google, ponieważ jej tłumaczenie brzmiało bardziej naturalnie. 

Inwestycja z Doliny Krzemowej

2 grudnia DeepL ogłosiła, że startup z Kolonii pozyskał nowego inwestora - firmę Benchmark z Doliny Krzemowej, zajmującą się kapitałem wysokiego ryzyka. Z zespołem 25 pracowników, DeepL planuje teraz podwoić swoje badania i rozwój w ciągu roku, mówi Kodak.

"To partnerstwo to nie tylko pieniądze, ale i połączenia. Będziemy mogli czerpać wiedzę z wywiadu biznesowego inwestora i innych startupów, które są dalej w procesie rozwoju," powiedział.

100 języków przeciwko dziewięciu

5 grudnia DeepL uruchomiła nowe usługi tłumaczeniowe w językach rosyjskim i portugalskim. Dzięki tym dwóm językom DeepL oferuje teraz dziewięć języków europejskich i w sumie 72 kombinacje językowe. Google Translate zna ponad 100 języków. Jednak startup nie chce zbyt szybko nadrobić zaległości. Jakość jest ważniejsza niż ilość, uważają założyciele.

"Chcemy mieć najlepszy system tłumaczenia maszynowego dostępny w każdym języku. Więc zamiast wprowadzać kilkaset języków tylko po to, aby były dostępne, trenujemy nasze sieci, aby zapewnić tę samą wysoką jakość, z której staliśmy się znani" - powiedział Kodak. 

Więcej znajdziesz na https://spokeo.pl/