Ik gebruik geen virtuele assistenten. Diep van binnen ben ik misschien sceptisch over het feit dat ik belangrijk genoeg ben om een assistent, virtueel of anderszins, te rechtvaardigen, of misschien is het gewoon zo dat mijn ervaring met het praten met mijn apparaten een beetje teleurstellend was. Van Siri en Google Now tot het vrolijk begroeten van mijn Xbox One, ik voelde me zelfbewust zonder voldoende beloning om de hele rompslomp de moeite waard te laten lijken.
Zie gerelateerd
Facebook maakt gebruik van kunstmatige intelligentie om foto's aan blinden voor te lezen
Inside Speech Graphics: het creëren van de virtuele gezichten van de toekomst
RIP Facebook M: Mark Zuckerberg bevestigt dat hij de Siri- en Cortana-rivaal van de site aan de kant zet
Met intriges van buitenstaanders woonde ik dus een reeks lezingen bij van Nuance, een van 's werelds grootste fabrikanten van spraakherkennings- en transcriptiesoftware. Ze klinken misschien niet als een bekende naam, maar het aantal klanten waarmee ze werken is zo uitgebreid dat het sneller voelt om de bedrijven op te sommen waarmee ze niet samenwerken dan de bedrijven waarmee ze wel samenwerken. Niettemin is hier een verre van uitgebreide selectie: Roku, Panasonic, LG, Samsung, Lexus, Ford, BMW, Toyota, Vodafone, BT, T-Mobile, Domino's, Coca-Cola, Barclays, Citi, Delta, Air France, FedEx , AT&T, BMW en de NHS. Kortom, ook al doet de naam Nuance geen belletje rinkelen, je hebt er waarschijnlijk wel eens mee te maken gehad. De AI’s verwerken jaarlijks 14 miljard klantcontacten, in 80 verschillende talen.
Als je bang bent dat dezelfde virtuele assistent die de toppings op je pizza uitkiest ook bij de NHS in de schijnwerpers staat, kun je opgelucht ademhalen. Hoewel er enkele gemeenschappelijke elementen zijn, hebben de verschillende kunstmatige intelligenties zeer verschillende functies – er is hier geen sprake van een alleskunner AI. Dit is de reden waarom Nils Lenke, senior directeur bedrijfsonderzoek bij Nuance Communications, niet veel heeft met het idee dat AI binnenkort de wereld zal overnemen, ook al houdt het bedrijf de zaken nauwlettend in de gaten en medeorganiseert het Winograd Schema Challenge – de opvolger van de Turingtest.
“De onderliggende technologie lijkt erg op elkaar, maar als je een systeem eenmaal hebt getraind, kan het maar één taak uitvoeren”, legt hij uit. “Dit Go-systeem is erg goed in het spelen van Go , maar kan geen gezichten herkennen of spraak verstaan. Wij [mensen] lossen al onze problemen op met hetzelfde brein, maar dit is niet wat deze systemen doen. Daarom is er nog een lange weg te gaan om de menselijke intelligentie na te bootsen – als dat ooit al mogelijk is.”
Het is inderdaad mogelijk dat de onwil van de ontwerpers van andere virtuele assistenten om deze beperkingen te accepteren de oorzaak is van waarom ik mijn ervaringen tot nu toe zo teleurstellend vond. Ik legde dit aan Lenke voor: "Precies, ze proberen de oceaan te koken, toch?" Als de assistent te algemeen is, zegt Lenke, weet je vaak niet zeker wat je nu eigenlijk kunt verwachten en waar de beperkingen liggen.
In plaats daarvan lijkt het erop dat het beperken van de reikwijdte van een virtuele assistent deze nuttiger maakt. “Met bijvoorbeeld een assistent van een chauffeur is het vrij duidelijk wat de problemen van een chauffeur zijn. Ze willen allemaal benzine, ze moeten allemaal weten wat het dashboard zegt, ze hebben allemaal iets te eten nodig: het is veel gemakkelijker om iets te bouwen dat nuttig is voor chauffeurs.”
“Er was een jaar geleden niet veel vraag naar virtuele assistenten die de naam van Jeremy Corbyn correct uitspraken, merkt hij op, terwijl elke AI die je vandaag op de hoogte houdt van het nieuws maar beter zou kunnen weten hoe hij de naam van de Labour-leider correct moet uitspreken.”
Deze vereenvoudiging komt zelfs neer op de opgenomen woordenschat. John West, hoofdoplossingsarchitect bij Nuance, vertelt me dat om ervoor te zorgen dat de gesynthetiseerde stemmen van virtuele assistenten vloeiend klinken, het woordenboek vaak wordt herzien om er zeker van te zijn dat er rekening wordt gehouden met de huidige trends. Een jaar geleden was er niet veel vraag naar virtuele assistenten die de naam van Jeremy Corbyn correct uitspraken, merkt hij op, terwijl elke AI die je vandaag op de hoogte brengt van het nieuws maar beter zou kunnen weten hoe hij de naam van de Labour-leider correct moet uitspreken. Dit is volgens Lenke nog een reden waarom het de voorkeur verdient dat een virtuele assistent zich specialiseert: “Je probeert te anticiperen op wat het domein is, en je genereert een stem op basis van samples uit dat domein. Als je vanuit elk domein een stem probeert te hebben die alles kan zeggen, kan de kwaliteit achteruitgaan.”
“Wat het geslacht van virtuele assistenten betreft, dat komt vaak neer op culturele verschillen per land – waarvan sommige zeer diepgewortelde en voorgeschreven opvattingen hebben over welk geslacht geschikt is voor elke taak.”
Over stemmen gesproken, iets wat mij altijd opvalt aan virtuele assistenten is de noodzaak dat ze überhaupt mannelijke of vrouwelijke tonen hebben. Welke plaats heeft gender eigenlijk voor kunstmatige intelligentie? “Het is een bewuste keuze die je moet maken”, zegt Lenke, en een keuze waar iedere opdrachtgever het laatste woord over heeft. "Je kunt zeggen dat je voor de illusie van een mens gaat, of je kunt zeggen: 'Ik wil dat mensen zien dat het een robot is', dus je geeft het een robotstem en er komt geen persona bij kijken." Wat gender betreft, dat komt vaak neer op culturele verschillen per land – waarvan sommige zeer diepgewortelde en voorgeschreven opvattingen hebben over welk geslacht geschikt is voor elke taak. Nogmaals, het is de keuze van de klant, en niet de taak van Nuance om zijn eigen filosofieën aan een bepaalde klant op te leggen.
De stemmen zelf klinken rijk, vloeiend en natuurlijk in de demo's die ik te zien krijg. Zouden er in theorie klanten kunnen zijn die hen voor mensen willen laten doorgaan, of in ieder geval niet willen vermelden dat ze een bot zijn die liegt door weglating? “Laat ik het zo zeggen: dat zou ik persoonlijk niet aanraden”, waarschuwt Lenke.
Maar hoe nuttig blijken virtuele assistenten te zijn? Nuance heeft verschillende belangrijke voorbeelden van verbeteringen in het bedrijfsleven, van stembiometrie die het wachtwoord overtreft, tot en met het verhogen van de arbeidstevredenheid van callcentermedewerkers omdat hun vervelende voorbereidende vragen automatisch worden afgehandeld. Maar wellicht het meest waardevol is de gezondheidszorg, een van de belangrijkste gebieden van het bedrijf.
“Britse artsen doen drieëneenhalf uur aan administratief werk per dag”, legt Frederik Brabant, Chief Medical Information Officer van Nuance, uit. Ik krijg een paar demo's te zien, een waarin een arts twintig recepten ongeveer een derde sneller kan voltooien met behulp van spraakopdrachten, en een andere waarin een zorgverlener alle relevante informatie over zijn verschillende patiënten op een iPad krijgt. Semantisch gezien lijkt het systeem artsen zelfs te vragen naar details die ze misschien zijn vergeten: welk type diabetes bijvoorbeeld, zodat hun aantekeningen zinvol zijn als ze worden overgedragen. Dit kan volgens Brabant leiden tot een omzetstijging van gemiddeld tussen de 6 en 8%.
Het doel hier is om het werk van artsen gemakkelijker te maken, en niet zozeer om hun professionele expertise te vervangen of te vergroten. “Artsen hebben daar een hekel aan. Wij willen geen instructies krijgen. De machine mag nooit zeggen: 'Je hebt zeven jaar geneeskunde gestudeerd, maar...'” Ondanks de beperkingen van een nog steeds grotendeels op papier gebaseerde NHS, wordt Dragon Medical gebruikt door meer dan 80% van de trusts in de
Groot-Brittannië met een verschillende mate van integratie. In termen van de toekomst zijn er echter toepassingen die verder gaan dan alleen administratie. Als u in een operatiekamer werkt, heeft u om voor de hand liggende hygiënische redenen geen toegang tot belangrijke informatie met uw handen, dus een stemassistent is volkomen logisch.
En het is hier dat de andere vooruitgang die het bedrijf in de toekomst wil maken, echt een rol gaat spelen: het intelligenter en logischer maken van de software. Ik krijg een voorbeeld: als je tegen je auto zegt: 'Reserveer een tafel bij Joe's Pizza na mijn laatste ontmoeting en laat Tom weten dat hij me daar kan ontmoeten', dan vertrouw je feitelijk op een onstuimige mix van grote kennis, semantische routing, planning, semantiek en dialoog. Het moet uw agenda raadplegen voor de laatste vergadertijd, een kaart raadplegen om te zien waar Joe's Pizza zich bevindt ten opzichte van de vergaderlocatie, het nummer van het restaurant opzoeken en proberen te boeken, vervolgens de contactgegevens van Tom zoeken en een bericht sturen . Dat is in de huidige vorm indrukwekkend, maar ze willen dat de auto Italiaanse kwaliteitsalternatieven kan vinden als Joe's Pizza helemaal volgeboekt is, en tijden kan voorstellen die voor iedereen werken. Theoretisch gezien is dit niet zo ver weg, en evenzo is een smartphone die een arts direct het aantal rode bloedcellen van een patiënt kan vertellen, razend dichtbij. Artsen moeten echter hun gehechtheid aan papier en pen verliezen en eerst 100% digitaal gaan.
“Theoretisch gezien is dit niet zo ver weg, en evenzo is een smartphone die een arts direct het aantal rode bloedcellen van een patiënt kan vertellen, razend dichtbij.”
“Persoonlijk denk ik dat er de komende vier tot vijf jaar veel kansen zullen zijn voor Groot-Brittannië in de digitale transitie, en dat nieuwe technologieën zoals stemherkenning en natuurlijke taalverwerking deze naar een hoger niveau zullen tillen”, besluit Brabant.
Nadat ik het evenement heb verlaten en terug naar kantoor ben gegaan, besluit ik de virtuele assistenten nog een keer te proberen. 'Oké Google,' zeg ik, 'navigeer me naar Goodge Street.' En dat gebeurt in een mum van tijd, waardoor ik me afvraag of er misschien toch wel een vacature is voor een virtuele assistent in mijn persoonlijke kantoor.
LEES VOLGENDE: 10 dingen die u moet begrijpen over kunstmatige intelligentie