Prehľad projektov, na ktorých sa podielame

Využitie multimediálneho výkladového slovníka pre modernú výučbu češtiny

Projekt je spolufinancovaný so štátnou podporou Technologickej agentúry ČR v rámci Programu ÉTA 5

Doba trvania projektu: 1. apríla 2021 - 31. decembra 2023
Partneri projektu: Lingea s.r.o. a Západočeská univerzita v Plzni, Fakulta aplikovaných věd

Cieľom projektu je zásadná kvalitatívna a obsahová inovácia Internetového slovníku súčasnej češtiny zapojením zvukových a obrazových informácií a nových funkcií so zameraním na interiorizáciu jeho používania študentami češtiny (aj ako cudzieho jazyka) a širokou verejnosťou, vrátane osôb so zmyslovým handicapom. Ide o spracovanie zvukovej stránky slovníka, ozvučenie heslových slov a prípravu dvoch syntetických hlasov na ozvučenie výkladov a príkladov, a to v niekoľkých modalitách: pre bežných hovoriacich, pre cudzincov učiacich sa jazyk, pre nevidiacich a slabozrakých, aj pre nepočujúcich. Projekt ďalej rieši spracovanie slovotvornej a tematickej klasifikácie hesiel, vytvorenie klasifikovanej databáze a začlenenie nového obrazového materiálu. Počíta tiež s vytvorením nástroja pre prípravu výučbových materiálov pre žiakov ZŠ a SŠ.

Nové metódy zvýšenia kvality, spoľahlivosti a efektivity prekladu
textu a videa v prostredí CAT nástroja

Logo OP POdnikání a inovace pro konkurenceschopnost
Projekt je spolufinancovaný Európskou úniou v rámci Európského fondu pro regionálny rozvoj,
Operačný program Podnikanie a inovácie pre konkurencieschopnosť

Skrátený názov projektu: AMT4CAT
Doba trvania projektu: 1. februára 2021 – 30. apríla 2024

Projekt se zaoberá výskumom a vývojom nových metód pre lokalizáciu textových dokumentov a videonahrávok, ktoré rozšíria súčasné CAT a MT nástroje o nové možnosti a kontrolné mechanismy pre zaistenie vyššej kvality a konzistencie výstupu naprieč všetkými cieľovými jazykmi. Nové funkcie a moduly budú integrované do systému Tygeris a posilnia jeho koncept all-in-one pre prekladateľov aj firmy, ktorým uľahčí prípravu multijazyčného obsahu a lokalizáciu dokumentov a multimediálnych súborov.

Multilingválny asistent pre hľadanie, analýzu a spracovanie informácií a podporu rozhodovania

Tento projekt je spolufinancovaný so štátnou podporou Technologickej agentúry ČR v rámci Programu TREND 3

Doba trvania projektu: 1. januára 2021 - 30. apríla 2024
Partneri projektu: Lingea s.r.o., FIT VUT v Brne, MFF UK v Prahe

Cieľom projektu je vytvorenie multilinguálneho asistenčného nástroja na podporu rozhodovania a prípravu informativných textov vysokej kvality. Asisten bude spracovávať dostupné informácie (lokálne súbory, e-maily, indexované weby) v bežne používaných formátoch (HTML, TXT, PDF, DOCX, XLSX, ODT apod.) a podporovaných jazykoch. Bude zo znalostnej báze odpovedať používateľovi na otázky a vyhľadávať podporu pre výsledky v indexovaných dokumentoch. Nástroj bude schopný sumarizovať veľké množstvo textu a automatizovane získavať dáta z webu, čím výrazne ušetrí čas používateľa. Bude obsahovať uživateľsky prístupné AI nástroje pre riešenie konkrétnych praktických problémov, napr. z oblasti predaja a marketingu.

Metódy hlbokého učenia pre syntézu reči ako zdroj inovácií vo výučbe jazykov

Skrátený názov projektu: TTS-TEACH2
Doba trvania projektu: 1. mája 2020 – 31. decembra 2022
Partneri projektu: SpeechTech, s.r.o. a Lingea s.r.o.

Projekt se zaoberá výskumom a vývojom nových metód počítačovej syntézy reči využívajúcich metódy hlbokého učenia (tzv. deep learning) pre generovanie hlasu pomocou neurónových sieti. Syntéza reči založená na týchto sieťach umožní oproti aktuálne používanej konkatenačnej syntéze jednoduchšie, rozsiahlejšie a prirodzenejšie modelovanie ľudského hlasu a umožní zásadné inovácie v jazykovej výučbe. Metóda a nový software sa aplikujú na 5 vybraných svetových jazykoch, dostupné budú na rozšírenom výučbovom portále.

Breakthrough Techniques Against Cybercrime and Terrorism

Projekt je spolufinancovaný Európskou úniou v rámci programu Horizon 2020

Doba trvania projektu: 1. septembra 2020 – 31. auguta 2022

Spoločnosť LINGEA se v rámci európskeho projektu AIDA zúčastňuje na boji proti kyberkriminalite. Cieľom projektu je analýza dát a vývoj nástrojov využívajúcich najmodernejšie metódy strojového učenia, umelej inteligencie a prediktívnej a vizuálnej analytiky na identifikáciu trestnej činnosti. AIDA sa zameriava na kyberkriminalitu a terorizmus - výsledný systém bude integrovať nástroje pre efektívnu ťažbu a analýtu veľkých dát špecifických pre bezpečnostné zložky. Spoločnosť LINGEA bola k projektu prizvaná ako špecialista na strojový preklad s mnohými jazykmi vrátane arabčiny a turečtiny.

Konsorcium zahŕňa 21 organizácií z 11 krajín EÚ, medzi nimi sú napr. Europol, University College Dublin, Ministerstvo vnútra Španielska, Ministerstvo spravodlivosť Portugalska a ďalšie významné štátne a akademické inštitúcie. Koordinátorom je spoločnosť ngineering Ingegneria Informatica S.p.A. LINGEA je jediným zástupcom východnej Európy v projekte. Vyskúšajte kvalitu našich prekladačov: https://translator.lingea.com/.

Project is supported by the EU under the Horizon 2020 programme, coordinated by Mr. Ernesto La Mattina, Engineering Ingegneria Informatica S.p.A.
Running from September1st, 2020 to August 31st, 2022
Web page: https://www.project-aida.eu/

Ukončené projekty

Využitie syntézy reči pre zlepšenie výučby cudzích jazykov

Doba trvania projektu: 1. októbra 2017 – 15. septembra 2019
Partneri projektu: SpeechTech, s.r.o. a Lingea s.r.o.

Projekt sa zaoberá výskumom využitia počítačovej syntézy reči na skvalitnenie výučby cudzích jazykov a vývojom výučbových systémov využívajúcich technológiu synstézy reči. Hlavným cieľom bude integrovať tieto technológie do výučbového portálu a zaviesť tak novú metódu interaktívnej výučby vybraných cudzích jazykov a nové typy cvičení založené na počúvané a precvičovaní správnej výslovnosti. Služba bude cielená ako na koncových používateľov, tak aj na učiteľov cudzích jazykov, ktorým umožní prípravu vlastných cvičení.

Riešenie projektu prebiehalo podľa plánu. Projekt bol ukončený 15. 9. 2019.

Online služba pre vysoko kvalitný automatický preklad medzi slovanskými jazykmi

Doba trvania projektu: 1. augusta 2017 – 31. januára 2020

Cieľom projektu je vytvoriť online nástroj (software) na rýchly a automatický preklad medzi slovanskými jazykmi, predovšetkým češtinou, slovenčinou, poľštinou a ruštinou. Výsledná služba bude dostupná všetkým záujemcom prostredníctvom API, a teda ju budú môcť využívať priamo z vlastných webových aplikácií a online služieb. Súčasťou riešenia budú aj ďalšie korektúrne a iné podporné nástroje a webová aplikácia pre sprístupnenie, aktiváciu a sledovanie využitia a spoplatnenia služby.

Riešenie projektu prebiehalo podľa plánu. Projekt bol ukončený 31. 1. 2020.

Health in my Language

Projekt je spolufinancovaný Európskou úniou v rámci programu Horizon 2020

Lingea je súčasťou významného jazykového projektu. Jeho koordinátorom je prestížna Edinburská univerzita. Hlavným koordinátorom programu Horizon 2020 je Barry Haddow zo spomenutej škótskej univerzity.

Doba trvania projektu: 1. februára 2015 – 31. januára 2018

Partneri projektu: Edinburská univerzita, Univerzita Karlova, Mnichovská univerzita, NHS 24, The Cochrane Collaboration a Lingea.
Webové stránky: www.himl.eu

Projekt Health in my language (ďalej HimL) si stanovil za cieľ poskytovať verejné zdravotnícke informácie v širšom spektre jazykov. Chce to dosiahnuť pomocou plne automatizovaného strojového prekladu, ktorý bude integrovaný do súčasných funkčných systémov prevádzkovaných NHS 24 a The Cochrane Collaboration.

V Európe je bežnou praxou, že informácie medicínskeho charakteru sú používateľom sprostredkované pomocou najrôznejších webových služieb. Vďaka nim môžu občania ľahko nájsť odpovede na svoje otázky alebo si nájsť príslušné služby v mieste svojho bydliska. Európska populácia je však značne mobilná a hovorí príliš mnohými jazkymi, a práve preto dnes stále častejšie zaznieva požiadavka, aby boli všetky poskytované informácie k dispozícii vo viacerých jazykoch. Aby sme mohli vyhovieť, musíme sa spoľahnúť na automatizovaný strojový preklad; objem prekladov do všetkých požadovaných jazykov je totiž taký, že nie je možné ho zvládnuť manuálne. Cieľom HimLu je využiť najnovšie pokroky v oblasti strojových prekladov a vytvotvoriť a následne uviesť do praxe systém, ktorý bude automaticky prekladať informácie medicínskeho charakteru, so špeciálnym dôrazom na zachovanie významu. Zvlášna pozornosť sa bude venovať adaptácii na domónu, prekladom do jazykov s bohatou morfológiou, managementu terminológie a strojovému prekladu s využitím sémantických postupov.

Všetko má viesť k vytvoreniu spoľahlivého, plne automatického a v praxi využiteľného strojového prekladača medicínskych textov, ktorý bude primárne testovaný na prekladoch z angličtiny do češtiny, poľštiny, rumunčiny a nemčiny. Všetky inovácie a vylepšenia budú v rámci projektu HimL postupne začleňované do systému storojového prekladu. Výsledky budú starostlivo vyhodnocované a testované zo strany používateľov.

Project is supported by the EU under the Horizon 2020 programme, coordinated by Barry Haddow, University of Edinburgh, Scotland.
Running from February 1st, 2015 to January 31st, 2018.
Partners: University of Edinburgh, Charles University, Prague, Ludwig Maximilian University of Munich, NHS24, The Cochrane Collaboration and Lingea.
Web page: www.himl.eu

HimL aims to make public health information available in a wider variety of languages. We will do this using fully automatic machine translation, integrating it into the live systems run by NHS24 and The Cochrane Collaboration.

To an ever-increasing extent, web-based services are providing a frontline for healthcare information in Europe. They help citizens find answers to their questions and help them understand and find the local services they need. However, due to the number of languages spoken in Europe, and the mobility of its population, there is a high demand for these services to be available in many languages. In order to satisfy this demand, we need to rely on automatic translation, as it is infeasible to manually translate into all languages requested. The aim of HimL is to use recent advances in machine translation to create and deploy a system for the automatic translation of public health information, with a special focus on meaning preservation. In particular, we will include recent work on domain adaptation, translation into morphological rich languages, terminology management, and semantically enhanced machine translation to build reliable machine translation for the health domain. The aim will be to create usable, reliable, fully automatic translation of public health information, initially testing with translation from English into Czech, Polish, Romanian and German. In the HimL project we will iterate cycles of incorporating improvements into the MT systems, with careful evaluation and user acceptance testing.

Meeting Assistant (MINT)

Príjemca: VUT Brno, Fakulta informačních technologií
Spolupríjemca: Lingea s.r.o., Phonexia s.r.o., Tovek s.r.o.
Riešitelia: doc. Dr. Ing. Jan Černocký, Ing. Ondřej Glembek, Ph.D, Mgr. Michal Kašpar, Ing. Sergij Černičko, Ing. Petr Schwartz, Ph.D. Ing. Miroslav Nečas, Ph.D.
Agentúra: TA ČR, program: Alfa, 4. verejná súťaž, kód: TA04011311, riešenie projektu: október 2014 - december 2017

Kľúčové slová:
jednanie; medziľudská komunikácia; rozpoznávanie reči; strojový preklad; dolovanie dát; sumarizácia; detekcia slabých signálov; meeting asistent

Cieľom projektu je výskum a vývoj v oblasti spracovania audia pri konaní medzi ľuďmi (schôdzka, jednanie tímov, jednanie so zákazníkmi, atď.) vedúca k vytvoreniu prototypu inteligentného asistenta pre pomoc pri jednaní (on-line), so spracovaním záznamu z jednania (off-line) a s následným systamatickým uchovávaním a zdieľaním záznamov jednania. Podrobnejšie informácie na stránkach projektu: http://mint-project.cz/

Riešenie projektu prebiehalo podľa plánu. Projekt bol ukončený 31. 12. 2017.
Hlavné princípy a výsledky projektu zachytáva demostračné video.

Projekt TA04011311 "Meeting assistant" bol riešený s finančoun podporou TA ČR

Technológie spracovania reči pre efektívnu komunikáciu človek-počítač

Príjemca: VUT Brno, Fakulta informačních technologií
Spolupríjemca: Lingea s.r.o., Phonexia s.r.o., Optimsys s.r.o.
Riešitelia: doc. Dr. Ing. Jan Černocký, Mgr. Michal Kašpar, RNDr. Pavel Cenek, Ing. Pavel Matějka, Ing. Petr Schwartz,Ph.D.
Agentúra: TA ČR, program: Alfa, kód: TA01011328, riešenie projektu: 2011-2014

Kľúčové slová:
rozpoznávanie reči, elektronické slovníky, obrana a bezpečnosť, mobilné zariadenia, dialógové systémy, CRM, eLearning

Cieľom projektu je vyvinút pokročilé techniky pre rozpoznávanie reči a nasadit ich v praktických aplikáciách: vyhľadávaní v elektronickom slovníku na mobilných zariadeniach, diktovaní prekladov, v bezpečnosti a obrane, v dialogových systémoch, systémoch starostlivosti o zákazníkov (CRM, helpdesk apod.) a v audiovizuálnom prístupe k výučbovým materiálom.

Riešenie projektu prebiehalo podľa plánu. Projekt bol ukončený 31. 12. 2014.

Projekt TA01011328 "Technológie spracovania reči pre efektívnu komunikáciu človrk-počítač" bol riešený s finančnou podporou TA ČR

Multilinguálne rozpoznávanie a vyhľadávanie v reči pre elektronické slovníky

Príjemca: Lingea s.r.o.
Spolupríjemca: VUT Brno, Fakulta informačních technologií
Riešitelia: Mgr. Michal Kašpar, doc. Dr. Ing. Jan Černocký
Agentúra: MPO ČR, program: Tip, kód: FR-TI1/034, riešenie projektu: 2009-2013

Kľúčové slová:
multilingualita, rozpoznávanie reči, detekcia kľúčových slov, elektronické slovníky

Projekt je zameraný na výskum, vývoj a overenie technológií, ktoré umožnia vytvárať systémy pre rozpoznávanie reči iba s malým množstvom prepísaných trénovacích dát, bez fonetickej a linguistickej expertízy. Tieto technológie by mali umožniť tvorbu rozpoznávačov aj pre jazyky, pre ktoré nie je dostatok trénovacích dát alebo nie sú dostupní experti a použitie klasických postupov. Vytvorené rozpoznávače potom plánujeme využiť v slovníkových aplikáciách. Projekt umožní efektívne použitie hlasových technológií aj pre iné jazyky než angličtinu. Projektom sa tak zhodnotia prostriedky dlhodobo vkladané do výskumu a vývoja. Projekt ďalej podporí významnú výskumnú skupinu Speech@FIT a posilní uplatnenia ich výstupov v praxi.

Projekt bol rozdelený do etáp:
Etapa 1. Dáta pre trénovanie a testovanie
Etapa 2. UBM prístup a JFA priestor pre popis akustických parametrov
Etapa 3. Automatická tvorba výslovnostných slovníkov
Etapa 4. Rozpoznávače reči pre nové jazyky
Etapa 5. Implementácia a integrácia

Riešenie projektu prebiehalo podľa plánu. Projekt bo ukončený 31. 8. 2013.

Tento projekt bol realizovaný za finančnej podpory z prostriedkov štátneho rozpočtu prostredníctvom Ministerstva priemyslu a obchodu ČR

Výskum a vývoj korpusových a hlasových technológií v novej generácii elektronických slovníkov

Príjemca: Lingea s.r.o.
Spolupríjemca: VUT Brno, Fakulta informačních technologií
Riešitelia: Mgr. Michal Kašpar, doc. Dr. Ing. Jan Černocký
Agentúra: MPO ČR, program: Tandem, kód: FT-TA3/006, riešenie projektu: 2006-2009

Kľúčové slová:
elektronické slovníky, audio korpusy, rozpoznávanie reči, syntéza reči, automatická segmentácia, detekcia kľúčových slov, textové korpusy, značkovanie korpusov, dolovanie informácií

Projekt je zameraný na vývoj novej generácie elektronických slovníkov s podporou moderných technológií založených na veľkých jazykových korpusoch a používateľskom prístupe pomocou automatického rozpoznávania reči. Korpusy boli doposiaľ známe vo vedeckej komunite a iba postupne prenikajú do softwarových produktov distribuovaných priamo používateľom. To isté platí o hlasových technológiách.

Projekt umožní firme Lingea posun v kvalite používateľských rozhraní slovníkov na českej aj európskej úrovni. Vďaka tomuto projektu sa zhodnotia prostriedky dlhodobo vkladané do výskumu a vývoja. Na strane Fakulty informačných technológií VUT v Brne projekt podporil významnú výskumnú skupinu Speech@FIT a posilní uplatnenie ich výstupov v praxi.

Projekt bol rozdelelný do etáp:
Etapa 1. Spracovanie signálu
Etapa 2. Hodnotenie výslovnosti
Etapa 3. Vyhľadávanie hlasom
Etapa 4. Textové a rečové korpusy
Etapa 5. Hlasový prístup ku korpusom
Etapa 6. Integrácia

Riešenie projektu prebiehalo podľa plánu. Projekt bol ukončený 31. 12. 2009.