Vytvárajú aplikáciu, ktorá mení dialekty

Pre nich to jednoducho nedávalo zmysel. Hovoril plynule anglicky aj španielsky, bol veľmi priateľský a odborník na systémové inžinierstvo. Prečo si nemohol udržať prácu v call centre?

Priateľ povedal, že jeho prízvuk sťažoval mnohým klientom porozumieť mu; Niektorí dokonca urážali kvôli tomu, ako hovoril.

Traja študenti si uvedomili, že problém je väčší ako skúsenosť ich priateľov. Preto založili startup, ktorý to vyriešil.

Teraz ich spoločnosť Sanas testuje softvér poháňaný umelou inteligenciou, ktorého cieľom je eliminovať nesprávnu komunikáciu zmenou akcentov ľudí v reálnom čase. Napríklad pracovník call centra na Filipínach môže normálne hovoriť do mikrofónu a nakoniec vyzerá ako niekto z KS pre zákazníka na druhom konci.

Zakladatelia startupu tvrdia, že call centrá sú len začiatok. Webová stránka spoločnosti opisuje svoje plány ako „reimagined talk“.

Nakoniec dúfajú v aplikáciu, ktorú vyvíjajú Budú ich využívať rôzne odvetvia a jednotlivci. Povedali, že to môže pomôcť lekárom lepšie porozumieť pacientom alebo pomôcť vnúčatám lepšie pochopiť svojich starých rodičov.

„Pre Sanas máme veľmi veľkú víziu,“ hovorí generálny riaditeľ Maxim Serebryakov.

A pre Serebryakova a jeho spoluzakladateľov je projekt osobný.

Nepočujete ani tak hlasy ľudí, ako ich prízvuky

Trojica, ktorá založila Sanas, sa stretla na Stanfordskej univerzite, ale všetci sú pôvodne z iných krajín — Serebryakov, teraz generálny riaditeľ, z Ruska; Andrés Pérez Sodiri, teraz finančný riaditeľ, pochádza z Venezuely. a Shun Zhang, teraz hlavný technologický riaditeľ, z Číny.

Už to nie sú študenti Stanfordu. Serebryakov a Peres absolvovali štúdium; Chang sa stiahol, aby sa sústredil na prinavrátenie Sanas k životu.

Spoločnosť spustili minulý rok a dali jej názov, ktorý sa dá ľahko vysloviť v rôznych jazykoch, „aby sme zdôraznili naše globálne poslanie a túžbu spájať ľudí,“ hovorí Perez.

READ  Ako Oldmobile's Toronado z roku 1966 prelomil novú cestu

V priebehu rokov všetci traja tvrdia, že experimentovali s tým, ako sa im do cesty môžu dostať dialekty.

„Všetci pochádzame z medzinárodného prostredia,“ hovorí Serebryakov. „Na vlastnej koži sme videli, ako sa k vám ľudia správajú odlišne len kvôli tomu, ako hovoríte.“ „Niekedy je to srdcervúce.“

Zhang hovorí, že jeho matka, ktorá prišla do USA pred viac ako 20 rokmi z Číny, ho stále núti rozprávať sa s pokladníkom, keď idú spolu nakupovať potraviny, pretože sa cíti trápne.

„To je jeden z dôvodov, prečo som sa pripojil k Maxovi a Andrésovi pri budovaní tejto spoločnosti a snažil som sa pomôcť ľuďom, ktorí si myslia, že ich hlasy nie sú tak dobre počuť ako ich prízvuk,“ hovorí.

Serebryakov hovorí, že videl, ako sa k jeho rodičom správajú v hoteloch, keď ho prídu navštíviť do USA – ako ľudia robia domnienky, keď počujú ich prízvuk.

„Hovoria trochu hlasnejšie,“ hovorí. „Menia svoje správanie.“

Perez hovorí, že po návšteve britskej školy mal spočiatku problémy s pochopením amerických dialektov, keď prišiel do Spojených štátov.

A nezačínajte tým, čo sa stane, keď sa jeho otec pokúsi použiť Amazon Alexa, ktorú mu dala jeho rodina na Vianoce.

„Rýchlo sme zistili, že keď Alexa rozsvietila svetlá na náhodných miestach v dome a urobila ich ružovými, Alexa vôbec nerozumela prízvuku môjho otca,“ hovorí Perez.

Call centrá testujú technológiu

Angličtina je tJe to najpoužívanejší jazyk na svete. Odhaduje sa, že ním hovorí 1,5 miliardy ľudí – a väčšina z nich nie sú rodení hovoriaci. Len v Spojených štátoch hovoria milióny ľudí angličtinou ako druhým jazykom.

To vytvorilo rastúci trh s aplikáciami, ktoré pomáhajú používateľom precvičovať si anglickú výslovnosť. Sanas však používa AI na iný prístup.

READ  YouTube odstrániť tlačidlo Nepáči sa mi pri videách? Nie, to sa stáva

Predpoklad: Namiesto toho, aby ste sa učili vyslovovať slová inak, technológia to môže urobiť za vás. Už nebude potrebné nákladné alebo časovo náročné školenie na zníženie prízvuku. A pochopenie bude takmer okamžité.

Serebryakov hovorí, že vie, že dialekty a identity ľudí môžu byť úzko prepojené, a zdôrazňuje, že spoločnosť sa nesnaží vymazať dialekty, ani nenaznačuje, že jeden spôsob reči je lepší ako iný.

„Umožňujeme ľuďom, aby nemuseli meniť spôsob, akým hovoria, aby obsadili pozíciu, zastávali prácu. Identita a dialekty sú kritické. Sú vzájomne prepojené,“ hovorí. „Nikdy nechceš, aby niekto zmenil svoj tón len preto, aby si niekoho potešil.“

Algoritmus Sanas dokáže v súčasnosti konvertovať angličtinu do az amerických, austrálskych, britských, filipínskych, hindských a španielskych dialektov a tím plánuje pridať ďalšie. Do systému môžu pridať nový tón trénovaním neurónovej siete so zvukovými nahrávkami od profesionálnych hercov a ďalšími údajmi – proces trvá niekoľko týždňov.

Tím Sanas odohral dve relácie CNN. V jednom bolo počuť muža s indickým prízvukom, ktorý čítal sériu literárnych viet. Tieto isté frázy sa potom prevedú do amerického dialektu:

Ďalší príklad s frázami, ktoré môžu byť bežnejšie v nastavení call centra, ako napríklad „Ak mi dáte svoje celé meno a číslo objednávky, môžeme pokračovať a začať za vás opravovať.“

Výsledky s americkým prízvukom znejú trochu umelo a integrovane, ako napríklad hlasy virtuálnych asistentov ako Siri a Alexa, ale Perez hovorí, že tím pracuje na zlepšení technológie.

„Tón sa mení, ale intonácia zostáva zachovaná,“ hovorí. „Pokračujeme v práci na tom, ako urobiť výsledok čo najprirodzenejším, emocionálnym a vzrušujúcim.“

Perez hovorí, že skorá spätná väzba od call centier, ktoré vyskúšali túto technológiu, bola pozitívna. Takže odošlite komentáre na ich webovú stránku, keď sa o ich projekte rozšíri správa.

Ako jeho budúcnosť vidia zakladatelia startupu

To umožnilo spoločnosti Sanas zvýšiť počet svojich zamestnancov. Väčšina zamestnancov Palo Alto so sídlom v Kalifornii pochádza z medzinárodného prostredia. Nie je to náhoda, hovorí Serebryakov.

READ  Nový reproduktor Sony prináša 5.1-kanálový priestorový zvuk z jednoduchého 2.1-kanálového systému

„To, čo budujeme, zarezonovalo u mnohých ľudí, dokonca aj u ľudí, ktorých najímame… Je naozaj vzrušujúce to vidieť,“ hovorí.

Ako spoločnosť rastie, môže chvíľu trvať, kým sa Sanas objaví v App Store alebo sa objaví na mobilnom telefóne vo vašej blízkosti.

Tím hovorí, že v súčasnosti spolupracuje s najväčšími outsourcingovými spoločnosťami pre call centrá a volia pomalšie zavádzanie pre jednotlivých používateľov, aby mohli zlepšiť technológiu a zaistiť bezpečnosť.

Táto snímka obrazovky ukazuje, čo používatelia vidia v počítačovej aplikácii Sanas.

Nakoniec však dúfajú, že každý, kto to potrebuje, to využije – aj v iných oblastiach.

Perez si predstavuje, že zohráva dôležitú úlohu pri pomoci ľuďom spojiť sa so svojimi lekármi.

„Každá strata sekundy v dôsledku nedorozumenia v dôsledku straty času alebo nesprávnych správ bude mať pravdepodobne veľmi veľký vplyv,“ hovorí. „Naozaj sa chceme uistiť, že sa pri preklade nič nestratí.“

Jedného dňa by to podľa neho mohlo pomôcť ľuďom naučiť sa jazyky, zlepšiť dabing filmov a pomôcť inteligentným reproduktorom v domácnostiach a hlasovým asistentom v autách porozumieť rôznym dialektom.

A nielen v angličtine – tím Sanas tiež dúfa, že do algoritmu pridá ďalšie jazyky.

Traja zakladatelia stále pracujú na detailoch. Ale ako by táto technológia mohla v budúcnosti zlepšiť konektivitu, je podľa nich niečo, čo je ľahké pochopiť.

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *