2019. 08. 16. - 10:35

A szerző hangján olvas fel műveket a mesterséges intelligencia

A szerző hangján olvas fel műveket a mesterséges intelligencia

Előnyös újítással állt elő egy kínai cég: a Sogou keresőmotor elérte, hogy a mesterséges intelligencia ismert regényeket olvasson fel a szerzőjük hangján.

Lehetővé vált, hogy a mesterséges intelligencia a szerző hangján olvasson fel műveket. A kínai keresőmotor Sogou állt elő az ötlettel, s olvastatott fel népszerű regényeket.
 
Bejelentette, hogy megalkották a kínai szerzők, Yue Guan és Bu Xin Tian Shang Diao Xian Bing videófelvételekből kreált élethű avatárjait, amelyek a kínai Online Irodalmi Konferencián mutatkoznak be.
 
Tavaly ugyanez a cég Sogou két mesterséges intelligencia-hírolvasót jelentetett meg, melyeket a Xinhua hírügynökség továbbra is használ.
 
Élethű avatárok olvassák fel a szerzők műveit a mesterséges intelligencia által
Élethű avatárok olvassák fel a szerzők műveit a mesterséges intelligencia által
 
Az audiokönyvek iránt Kínában egyre nagyobb az érdeklődés, ami hasonlóságot mutat a nyugati trendekkel.
 
Az iiMedia kínai ötletgyűjtő várakozásai szerint a piac 2016 és 2020 között több mint kétszeresére nő, évi 7,8 milliárd kínai jüanra (ami nagyjából 900 millió font).
 
Ma már egyszerű eljárásnak minősül a szöveg beszéddé változtatásának technológiája, ezzel rövid időn belül létre lehet hozni egy könyv audio változatát digitalizált formában, szintetikus hangok felhasználásával.
 
A legtöbb ember azonban a hangoskönyveket részesíti előnyben, melyek a szerzők, színészek vagy híres közszereplők hangján szólalnak meg, professzionális előadásban.
 
Mostanra a gépi tanulás és a beszéd-szöveg technológiák fejlődésének köszönhetően a digitalizált hangok élethűbbé válnak. Példának okáért a Lyrebird cég lehetővé teszi ügyfelei számára, hogy személyre szabott hangavatárokat hozzanak létre, csupán egyperces hangfelvétel alapján.
 
Weboldalán bemutatja szolgáltatásait, méghozzá Barack Obama egykori elnök és Donald Trump jelenlegi amerikai elnök két hangfelvételével – ezeket szintén gépi tanulással alkották meg.
 
Eközben egyébként a londoni székhelyű DeepZen start-up úgy véli, szintetikus beszédtechnológiája egy audiokönyv több változatát képes létrehozni, pár óra leforgása alatt, rengeteg időt megspórolva ezzel, illetve a költségek 90 százalékát.
 
László Adrienn
 

Hírlevél feliratkozás

Kérjük, add meg adataidat a hírlevélre történő feliratkozáshoz! A megadott adatokat bizalmasan kezeljük, azokat harmadik félnek át nem adjuk.

 

gyulai_vafurdo

profight_banner.