2019. 08. 16. - 10:35

A szerző hangján olvas fel műveket a mesterséges intelligencia

Előnyös újítással állt elő egy kínai cég: a Sogou keresőmotor elérte, hogy a mesterséges intelligencia ismert regényeket olvasson fel a szerzőjük hangján.

Lehetővé vált, hogy a mesterséges intelligencia a szerző hangján olvasson fel műveket. A kínai keresőmotor Sogou állt elő az ötlettel, s olvastatott fel népszerű regényeket.

Bejelentette, hogy megalkották a kínai szerzők, Yue Guan és Bu Xin Tian Shang Diao Xian Bing videófelvételekből kreált élethű avatárjait, amelyek a kínai Online Irodalmi Konferencián mutatkoznak be.

Tavaly ugyanez a cég Sogou két mesterséges intelligencia-hírolvasót jelentetett meg, melyeket a Xinhua hírügynökség továbbra is használ.

Élethű avatárok olvassák fel a szerzők műveit a mesterséges intelligencia által

Az audiokönyvek iránt Kínában egyre nagyobb az érdeklődés, ami hasonlóságot mutat a nyugati trendekkel.

Az iiMedia kínai ötletgyűjtő várakozásai szerint a piac 2016 és 2020 között több mint kétszeresére nő, évi 7,8 milliárd kínai jüanra (ami nagyjából 900 millió font).

Ma már egyszerű eljárásnak minősül a szöveg beszéddé változtatásának technológiája, ezzel rövid időn belül létre lehet hozni egy könyv audio változatát digitalizált formában, szintetikus hangok felhasználásával.

A legtöbb ember azonban a hangoskönyveket részesíti előnyben, melyek a szerzők, színészek vagy híres közszereplők hangján szólalnak meg, professzionális előadásban.

Mostanra a gépi tanulás és a beszéd-szöveg technológiák fejlődésének köszönhetően a digitalizált hangok élethűbbé válnak. Példának okáért a Lyrebird cég lehetővé teszi ügyfelei számára, hogy személyre szabott hangavatárokat hozzanak létre, csupán egyperces hangfelvétel alapján.

Weboldalán bemutatja szolgáltatásait, méghozzá Barack Obama egykori elnök és Donald Trump jelenlegi amerikai elnök két hangfelvételével – ezeket szintén gépi tanulással alkották meg.

Eközben egyébként a londoni székhelyű DeepZen start-up úgy véli, szintetikus beszédtechnológiája egy audiokönyv több változatát képes létrehozni, pár óra leforgása alatt, rengeteg időt megspórolva ezzel, illetve a költségek 90 százalékát.

László Adrienn

A szerző hangján olvas fel műveket a mesterséges intelligencia

Hírlevél feliratkozás

MI-alapú automatizációk jönnek a KKV-k számára

Egyre több a mesterséges intelligencia konferencia

Idén is működnek a jégkármentesítő automaták

Az okosotthonokról lesz szó a pécsi konferencián

Nagy sikert aratott az első kínai humanoid robotkonferencia

Ilyen környéken nem nagy a szívroham esélye – mondta a mesterséges intelligencia

Robotterápiás Centrum nyílt a Bethesda Gyermekkórházban