Egy idegen faj nyelvét is lefordítja az AI – egy lengyel, aki megelőzi a Google-t és maga mögött tartaná a ChatGPT-t

Breaking News

Egy idegen faj nyelvét is lefordítja az AI – egy lengyel, aki megelőzi a Google-t és maga mögött tartaná a ChatGPT-t

Forbes
10 Aug, 2023
Címkék: #Üzlet # AI # chatGPT # Google # mesterséges intelligencia # microsoft # sikersztori # sikertörténet # startup # technológia # vállalkozó

A DeepL fordító szoftver a pontossága miatt nagyon népszerű, de egy óriások által uralt piacon kell versenyképesnek lennie. Különutas módszerrel jutottak idáig, de komoly belső fejlesztésre készülnek, mert a piac hatalmas, de jó megoldásból a tőkeerős versenyzők ellenére is hiány van. Így nőtt nagyra egy lengyel programozó ötlete. Megszorongatja majd a Google-t és a ChatGPT-t?

Jaroslaw Kutylowski beszél németül, lengyelül és angolul (és tud kólát rendelni franciául). A DeepL, a startupja mesterséges intelligenciával működő fordítóeszközével még körülbelül 30 nyelven tud írni és olvasni.

Együtt dolgozik az AI és az emberek

A munkatársai és barátai által Jareknek nevezett alapító 10 évesen kezdett programozni, aztán Wroclaw-ban tanult informatikát, de a doktoriját már Paderbornban, Németországban szerezte. Innentől maradt Németországban, itt kezdte karrierjét. Ennek egyik legfontosabb állomása a Linguee nevű fordító oldal volt, ekkor költözött Kölnbe, a cég technológiai vezetője volt. 2016-tól kezdett el egy saját fordítási technológián dolgozni, de ezt már nem egy cégen belüli pilotként vitte tovább, hanem inkább saját vállalkozást alapított.

A 2017-ben szintén Kölnben indított startup olyan fordítószoftvert fejlesztett ki, amely állítása szerint sokkal pontosabb, mint a Google és a többi rivális, köszönhetően annak az erős mesterséges intelligenciának, ami a program lelke. A rendszer anyanyelvi beszélőkkel együttműködve dolgozik.

A DeepL saját fejlesztésű, neurális hálózati architektúráját (pontosabban: neurális gépi fordítását, azaz NMT) – egy olyan gépi tanulási technológiát, amely segít a számítógépnek ugyanúgy megtanulni az információkat, ahogyan az emberi agy teszi – 31 különböző, köztük kínai, orosz, spanyol, olasz és magyar, nyelven nyilvánosan elérhető kétnyelvű (azaz lefordított) és egynyelvű szövegek hatalmas adatbázisán trenírozzák. A szoftver az angol-magyar nyelvpáron is nagyon megbízhatóan működik.

Ez a szám, a 31, jóval alatta van a Google által kínált 130 nyelvnek, de a DeepL szeretne minél szofisztikáltabb megoldásokat nyújtani, ezért szerkesztők és lektorok dolgoznak azon, hogy az algoritmus minél több jelentésbeli árnyalatot képes legyen átadni.

A cél az, hogy a lefordított szövegről ne lehessen megmondani, hogy gép készítette.

Összesen 20 szerkesztő dolgozik a cégnél, de rajtuk kívül több mint 1000 anyanyelvi beszélővel és fordítóval van még szerződésük, akik szintén azon dolgoznak, hogy a fordítások minél pontosabbak legyenek. Ők értékelik azokat a megoldásokat, amiket a DeepL által használt mesterséges intelligencia (AI) felkínál és ha kell, korrigálják azokat – a rendszer természetesen mindezeket megtanulja és beépíti nyelvi modelljeibe. Az AI forradalom kellős közepén különösnek tűnhet, hogy ekkora humán munkaerőt is bevonnak.

„Rengeteg jó minőségű, emberi által fordított adatra van szükségünk, hogy megtanuljuk egy nyelv sajátosságait és lefordíthassuk mind a hétköznapi, mind a hivatalos szövegeket”

– mondta erről az alapító Kutylowski.

„Lényegében minden neurális hálózatot egy kicsit úgy képzelhetünk el, mint egy emberi agyat. És kezdetben ez az agy még eléggé képzetlen. Nem tudja, hogy mit kell tennie. Ez ugyanaz, mint a kisgyermekeink esetében, akik erre a világra jönnek, és nem tudnak beszélni, alapvetően semmit sem tudnak csinálni. Aztán betanítjuk ezt a neurális hálózatot, mégpedig úgy, hogy rengeteg példát mutatunk arra, hogyan lehet fordítani, és ahogy a neurális hálózat egyre több fordítást lát, megtanulja, hogyan kell ezt csinálni. Minden alkalommal, amikor jól fordít, pozitív visszajelzést adunk a neurális hálózatnak vagy a mesterséges intelligenciának. És ebből ez a hatalmas matematikai gépezet megtanulja, hogyan kell fordítani, és egyre jobbá és jobbá válik” – magyarázta korábban a Vision Vibes podcastnak, hogyan dolgoznak.

„Ez teljesen általános, és minden nyelv esetében működik. Úgyhogy azt hiszem, ha adott lenne egy idegen faj nyelve, az is olyasmi lehetne, amire be tudnánk tanítani az AI-t. Ehhez persze szükség lenne egy megfelelő fordításkészletre, amivel megtaníthatnánk az AI-t.”

A DeepL 25 millió eszközre került letöltésre eddig – ez elenyésző a Google Translate-hez képest, amely több mint 1 milliárd eszközön van jelen. De azok, akik használták, dicsérik a pontosságát. Nina Gafni, hivatásos fordító, aki korábban az FBI-nak dolgozott nyelvészként és fordítóként, a DeepL-t használja francia, német és olasz szövegek angolra fordítására. Azt mondja, hogy bár a gépi tanulási rendszerek sosem lesznek teljesen tökéletesek a fordításokban, a DeepL fordításai kulturálisan árnyaltabbak és pontosabbak, mint a legtöbbé.

„Néha a gépi fordítások túlságosan szó szerintiek lehetnek, és ez nagy probléma” – mondta Gafni a Forbesnak. „Ha nehéz helyzetben vagyok, úgy érzem, hogy sokkal jobban támaszkodhatok a DeepL-re, mint a Google Translate-re.”

A DeepL korábban már felkerült a CB Insights top AI cégeit összegyűjtő listájára – amúgy a magyar Turbine AI-al együtt. Most az amerikai Forbes Cloud 100 összeállításába is bekerültek (a magyar Cloud 50 lista itt található).

Jól fordít, de hogy lesz ebből üzlet?

Az AI fejlesztés és több mint 1000, a rendszer javításán dolgozó ember persze nem olcsó. Miből van pénze egy fordító szoftvert fejlesztő cégnek?

A DeepL több mint 10 millió havi aktív felhasználóval büszkélkedhet, közülük 500 ezren havonta 9 és 59 dollár közötti összeget fizetnek a platform szolgáltatásaiért. Az alap fordító mobilappon és böngészőből is elérhető ingyen.

De kik használják a DeepL-t? Például nagyszülők, hogy anyanyelvükön tudjanak beszélni unokáikkal vagy nyelvi akadályokba ütköző szerelmes párok. Ebben a globalizált világban sem lenne mindez elegendő a sikerhez.

A DeepL üzletének nagy részét a 20 000 vállalati ügyfél – többek között a Mercedes Benz, a Fujitsu és a Deutsche Bahn német vasúttársaság – teszi ki.

Ők a DeepL szoftverét használják a weboldalak, jogi szerződések és ügyfélmegállapodások, e-mailek, marketing szövegek vagy akár PowerPoint diák fordítására.

2023 januárjában a kölni székhelyű startup a Pitchbook adatbázisa szerint mintegy 100 millió dolláros finanszírozást szerzett olyan globális kockázati tőkebefektető cégektől, mint az Institutional Venture Partners (IVP), az Atomico és a Bessemer Venture Partners, 1 milliárd dolláros értékelés mellett. Ezzel a startup bekerült az unikornisok közé. Kutylowski az amerikai Forbesnak nem erősítette meg, hogy cégének eddig összesen mennyi finanszírozást sikerült összegyűjtenie.

A DeepL lehetővé teszi a felhasználók számára, hogy teljes dokumentumokat, például PDF, Word doksikat vagy PowerPoint prezentációkat fordítsanak le vele, miközben a formázás érintetlen marad. Alternatív fordításokat és jelentésbeli módosításokat is javasol, és lehetővé teszi a felhasználók számára, hogy egyéni szótárat hozzanak létre, amelyben megadhatják, hogy bizonyos szavakat hogyan kell lefordítani. Ez például szakszövegek fordításánál lehet nagyon hasznos.

Nagy nyelvi modellek: egyelőre hátrányban, de az Nvidia besegít

Az informatikából doktorált Kutylowski 2016-ban fejlesztette ki a DeepL alapjául szolgáló gépi tanulási technológiát. A Google kutatói ekkortájt dolgoztak a nyelvi modellezést új irányból megközelítő eszközükön, a Transformer projekten. Ez egy, az addigiakhoz képest pontosabb és erőforrás szempontjából is hatékonyabban működő szoftver volt, pontosabban egy gépi tanulási modell, ami mélyebb nyelvi megértést tett lehetővé. Ez a Google Fordító alapja, de használja a ChatGPT is.

Hogy a DeepL hogyan épül fel pontosan, azt a Forbesnak Kutylowski nem árulta el, de annyit lehet tudni, hogy ma a rendszer sem a Transformert, sem más nagy nyelvi modellt (large language modell, azaz LLM) nem használ. Nagyon hamar tudták viszont, hogy milyen irányba kell elindulniuk.

„Tudtuk, hogy a neurális hálózatok nagyon hamar uralni fogják ezt a területet” – mondta Kutylowski a kezdetekről. „Meg voltunk győződve arról, hogy bármi, amit korábban fordításra használtak, mint például a statisztikai módszerek, a jövőben nem lesz alkalmazható.” Akkor, amikor Kutylowski még informatikai kutatóként meglátta, hogy az AI-nak fontos szerepe lesz a fordításban, a Google is ilyen statisztikai modelleket (Statistical Machine Translation, azaz SMT) használt. A DeepL által használt technológiáról nem sokat tudni, egyelőre publikáció sem jelent meg róla.

Ami biztos: a DeepL nem rendelkezik saját LLM-programmal – még. Kutylowski a Forbesnak annyit elárult, hogy tervezi, hogy házon belül épít egyet, és a jobb eredmények érdekében kombinálja a jelenlegi, kisebb fordítási modelljével. Ennek érdekében a DeepL az Nvidia svédországi, AI-fókuszú adatközpontjának segítségével bővíti a számítási kapacitásait az AI-modellek képzéséhez.

„A generatív AI hatalmas lehetőség. Lehetővé teszi számunkra, hogy a fordítás tetejére olyan funkciókat építsünk, ahol a fordító interaktívabbá válik, vagyis inkább párbeszédet folytat veled.”

Google, Microsoft: óriások uralta piac

A további növekedéshez elengedhetetlen lesz egy ilyen nagy modell létrehozása, még akkor is, ha a DeepL sikerében fontos tényező, hogy egy különutas megoldást választott. Ez eddig biztosította a pontosságot, de a jövő szempontjából a skálázhatóság is kiemelten fontos.

Karthik Ramakrishnan, az IVP partnere vezette a DeepL 100 millió dolláros befektetési körét. A fordítási szolgáltatásoknak 27,9 milliárd dolláros globális piaca van, és szerinte ezt a piacot eddig nem sikerült jól kihasználni. „A fordítások túlnyomó többsége még mindig nagyon manuális, elavult munkafolyamat” – mondta Ramakrishnan. „Az emberek kiszervezett nyelvi szolgáltatókat vesznek igénybe, akiknek napokig vagy akár hetekig is eltart, amíg a lefordított tartalmakat időben megkapják.”

A fordítószoftverek legnagyobb előnye jelenleg a gyorsaság, a verseny arról is szól, hogy a pontosságával, ki tud majd mindenki elé kerülni.

A DeepL jó pozícióban van ahhoz, hogy ezen a piacon nagyot menjen, de ez egy óriások által uralt piac.

A Google évtizedek óta fektet a mesterséges intelligenciába és 130 nyelvre tud fordítani, a Microsoft Translator is több mint 100 nyelvet tud, és olyan nagyvállalati partnerek használják a megoldásaikat, mint a Volkswagen konszern. Az AI-t a mainstream szintre emelő ChatGPT is folyamatosan dolgozik nagy nyelvi modelljén, amely most 50 nyelvet támogat és egyelőre sok hibával dolgozik. Erőforrás azonban bőven van az előrelépéshez.

Hozzájuk képest, az a több mint 100 millió dollár, amit eddig a DeepL befektetőktől bevont, szinte semmi. Ez ugyanakkor szólhat a startup mellett is: hiszen

szinte semmiből jutottak el oda, hogy a Google valós kihívóként tekintsen rájuk.

The post Egy idegen faj nyelvét is lefordítja az AI – egy lengyel, aki megelőzi a Google-t és maga mögött tartaná a ChatGPT-t appeared first on Forbes.hu.