D O K U M E N T U M A Z O N O S Í T Ó F á j l n é v : feldmann_varga_azure_kutatasok.jpg B é l y e g k é p : https://dka.oszk.hu/079800/079887/feldmann_varga_azure_kutatasok_kiskep.jpg F ő c í m : Azure felhőben folyó kutatások B e s o r o l á s i c í m : Azure felhőben folyó kutatások E g y é b c í m : HilBERT magyar nyelvi neurális modell és hasznosítása M i n ő s í t ő : alcím S z e r e p : létrehozó B e s o r o l á s i n é v : Feldmann U t ó n é v : Ádám I n v e r t á l a n d ó n é v : N E g y é b n é v e l e m e k : Dr. S z e r e p : létrehozó B e s o r o l á s i n é v : Varga U t ó n é v : Gábor I n v e r t á l a n d ó n é v : N E s e m é n y : felvéve I d ő p o n t : 2022-01-12 E s e m é n y : elérhető I d ő p o n t : 2021-04-08 D á t u m r a v o n a t k o z ó m e g j e g y z é s : Az előadás időpontja. A t í p u s n e v e : prezentáció A t í p u s n e v e : előadás M e g n e v e z é s : Prezentáció M e g n e v e z é s : Könyvtártudomány - prezentáció M e g n e v e z é s : Networkshop 2021 M e g n e v e z é s : Videotorium A j o g t u l a j d o n o s n e v e : Dr. Feldmann Ádám, Varga Gábor S z e r z ő i j o g i m e g j e g y z é s e k : Jogvédett T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Mesterséges intelligencia T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Biztonság T é m a k ö r : Számítástechnika, hálózatok A l t é m a k ö r : Internet használat T á r g y s z ó : mesterséges intelligencia M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : felhő alapú szolgáltatás M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : adatbiztonság M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : nyelvismeret M i n ő s í t ő : tárgyszó/kulcsszó T á r g y s z ó : 2021 M i n ő s í t ő : időszak K é p a l á í r á s : Azure felhőben folyó kutatások:
HilBERT magyar nyelvi neurális modell és hasznosítása N y e r s v a g y O C R - e s s z ö v e g : Azure felhőben folyó kutatások:
HilBERT magyar nyelvi neurális modell és
hasznosítása
Delivery fókuszú magyar nyelvi megértés
Dr. Feldmann Ádám
PTE
Varga Gábor, Microsoft Magyarország
National Technology Officer
Magyar kutatások Azure támogatásával
Genetika: genom szekvenálás
Deepfake azonosítása
Betegségek felismerése emberi hangból
Biodiverzitás megőrzése: vadlovak azonosítása
Gyógyszerhatóanyag szűrése molekula illesztéssel
Autonóm robotjármű vezérlése és modellezése
Univerzális vakcina és személyes gyógymód kutatás
Magyar nyelv neurális modelljének megalkotása
Hibrid felhő az MTA Cloud-dal
Hibrid HPC alkalmazási modellje
Stb.
Adatok biztonsága az életciklus minden szakaszában
Megoldott
Nyugalomban
Inaktív adatok titkosítása amikor blobokban, adatbázisban stb. van tárolva.
Példák:
Bitlocker
Azure Storage Service
Encryption for Data at Rest
SQL Server Transparent Database Encryption (TDE)
Mozgásban
Adatok titkosítása miközben mozgásban van ellenőrizetlen hálózatokon
Példák:
HTTPS
TLS
Még nem elterjedt
Használatban
Védeni és titkosítani az adatot akkor is, amikor használatban van, és műveletek folynak rajta
Példák:
Trusted Execution Environments (CC)
Homomorf titkosítás (HE)
Különbségi adatvédelem (DP)
Többrésztvevős számítások (MPC)
Miért fontos a használat közbeni adatvédelem
Magyar nyelvű NLU szükségessége
Egyszerűen kezelhető magyar nyelvmegértő kognitív szolgáltatásra van szükség felhőben és on-prem.
(API hívással, konténerben, skálázhatóan és területspecifikusra formálhatóan)
A nyelvi technológia kiemelt lehet alkalmazásfejlesztésben, világos ki- és bemenetekkel.
Referencia architektúrák (voice bot, chatbot, IoT vezérlés)
Azure példák
IoT-eszközök vezérlése hangvezérelt asszisztens használatával
Azure példák
Csevegőrobot szállodai foglalásokhoz
Azure példák
Nagyvállalati szintű társalgási robot létrehozása
Azure példák
Kiskereskedelmi asszisztens vizuális funkciókkal
Közös elemük a LUIS
Általános nyelvi megértő szolgáltatás. Az előbb bemutatott területeken mind használatos.
Egyszerű API hívásokkal lehet felhasználni + annotációs tool.
Nem tud magyarul.
Mit azonosít a LUIS?
Szándékot (intent)
Szereplőket (entity)
Hangulatot (sentiment)
Ezeket a szövegelemeket adja vissza struktúrált formában (JSON)
Nyelvi modell
Rendelkezésre állnak
HIÁNYZIK!!!
Adatok finomhangoláshoz
De! Könnyen használható technológia áll rendelkezésre az elkészítéséhez!
Doccano használata a feladatspecifikus tanító adatok előkészítéséhez
Open soure megoldás többféle feladattípushoz
Egy projekten többen is dolgozhatnak
Közösségi adatcímkézés
Azure környezetek NLP/NLU tanításhoz
Részletes, a magyar nyelv specifikus programokat tartalmazó repozitóriumok.
Letölthető és tovább tanítható modellek (folyamatosan bővül)
Alapmodell készítés lehetősége részletes technikai útmutatással
Transfer learning szkriptek
Kész eszközök elhelyezése AKS-ben
NLU pipeline magyar nyelvhez
1. MI modellek tanítása és transzfertanítása
Feladatspecifikus tanítóadatok létrehozása
Hamarosan letölthető a teljes pipeline a HILANCO oldalról. (https://hilanco.github.io/) D o k u m e n t u m n y e l v e : magyar K a p c s o l ó d ó d o k u m e n t u m n e v e : Molnár Tamás: Mesterséges intelligencia és csevegőrobotok alkalmazása az oktatásban A f o r m á t u m n e v e : PowerPoint prezentáció O l d a l a k s z á m a : 18 T e c h n i k a i m e g j e g y z é s : Microsoft Office PowerPoint 2016 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : PDF dokumentum O l d a l a k s z á m a : 18 M e t a a d a t a d o k u m e n t u m b a n : N A f o r m á t u m n e v e : HTML dokumentum T e c h n i k a i m e g j e g y z é s : HTML 5 verzió M e t a a d a t a d o k u m e n t u m b a n : N L e g j o b b f o r m á t u m : JPEG képállomány L e g n a g y o b b k é p m é r e t : 770x433 pixel L e g j o b b f e l b o n t á s : 72 DPI S z í n : színes T ö m ö r í t é s m i n ő s é g e : közepesen tömörített Á l t a l á n o s m e g j e g y z é s : Networkshop 2021 konferencia A z a d a t r e k o r d s t á t u s z a : KÉSZ S z e r e p / m i n ő s é g : katalogizálás A f e l d o l g o z ó n e v e : Nagy Zsuzsanna |