S tím, jak se rozvíjejí nové technologie, prosazují se i nové formy ovládání. Hlasové ovládání je technologie, kterou předvídali vlastně všichni autoři scifi: Bavit se s počítačem lidským hlasem je přece tak intuitivní a snadné! Na hlasové ovládání narazíme v Kubrickově 2001: A Space Odyssey (1968), kde hanebný počítač nejenže odmítá plnit lidské rozkazy, ale také se pokouší kamerami odečítat ze rtů, jak se na něj lidé domlouvají. V Příbězích pilota Pirxe od Stanislawa Lema (1966) sice počítač rachotí svými relé, ale umí rozeznat hlasové příkazy a odpovídat na ně. Hlas je prostě intuitivní věc, takže všichni čekali, že se ovládání hlasem objeví brzy.
Ale ouha! Zatímco hlasová syntéza je relativně jednoduchý úkol – tedy pokud netrváte na tom, aby to znělo přirozeně, rozeznávání hlasu složitý problém je. Pracuje se na něm dlouho: Konkrétně v roce 1952 se objevil systém Audrey, vyvinutý v Bell Labs, který uměl rozeznávat hlasem zadávané číslice. Na Seattle World Fair 1962 představila IBM projekt Shoebox, což byl stroj, který uměl rozeznávat šestnáct slov. Nevýhodou bylo to, že se na každého mluvčího musel nastavit zvlášť – co si budeme povídat, lidem je někdy těžké rozumět, i když jste sami člověk.
V sedmdesátých letech se do věci vložila americká DARPA, která se rozhodla zasponzorovat program, jehož výsledkem by byl stroj, který by se naučil rozeznávat alespoň tisíc slov. To se podařilo splnit, ale vývoj nešel příliš rychle, ještě v polovině 80. let byl nejlepším projektem Tangora od IBM, která dokázala rozeznat dvacet tisíc slov. Díky pokrokům v AI už stroj dokázal odhadovat pravděpodobnost, že zvuk, který nedokázal přesně rozeznat, je součástí slova.
V roce 1990 se konečně objevil Dragon Dictate, první komerční systém pro rozeznávání diktátu, který ale vyžadoval zřetelnou mluvu a jasné oddělování slov. Teprve v roce 2002 se ale objevuje rozeznávání řeči jako standardní součást Microsoft Office. Obrovské pokroky pro rozeznávání řeči znamenal internet. Dovolil tvorbu služeb, kdy se program mohl kdykoliv připojit k serveru s nerozeznatelnou sekvencí, která se pak použila pro další trénink systému. Zpětná vazba je důležitou součástí vývoje umělé inteligence a dovoluje její rozvíjení. Není proto divu, že to byl Google, kdo jako první uvedl hlasové ovládání pro mobilní zařízení v roce 2008.
V té době už svoje technologie připravovali všichni velcí hráči. Apple oznámil v roce 2011 technologii Siri, Microsoft uvedl v roce 2014 Cortanu a v témže roce Amazon představil technologii Echo pro jejich domácího asistenta Alexu. Tyto technologie jsou na jednu stranu trochu děsivé, protože domácí zařízení vás vlastně „tak trochu stále poslouchají“, dovolují ale extrémně jednoduché zadávání příkazů, i když máte „plné ruce práce“, takže vlastně plní roli vašeho osobního asistenta.
Pro úspěch hlasového ovládání je důležitý právě vzestup umělé inteligence, její schopnosti učit se z rozsáhlých dat a pracovat s neurčitou informací. Moderní AI chápe do značné míry kontext rozhovoru, takže místo zadávání příkazů vedete se zařízením svého druhu dialog. Můžete klást doplňující dotazy, ale také žádat svého asistenta o zábavu či o to, aby vás pobavil vtipem. Tohle už je komunikace blížící se představám autorů sci-fi!
S rozeznáváním hlasu ovšem vývoj ovládání nekončí. Dalším krokem bude ovládání na základě obrazu a dalších dat, které je nezbytné pro vývoj autonomních vozidel. Ta musí zpracovávat velmi komplexní informace včetně rozeznávání dopravních značek a provádět řadu autonomních rozhodnutí. Zjednodušeně řečeno můžeme říci, že budoucnost ovládání strojů je vlastně v tom, že už je nebudeme ovládat krok za krokem, ale necháme je rozhodovat se do značné míry samostatně.
Už v raných sci-fi se objevovaly představy o tom, že počítače budoucnosti se nebudou programovat, jenom se jim specifikuje úkol a ony vše vyřeší samy. Zatím se podobné úrovni ani neblížíme, ale velkou řadu úkolů už zvládají stroje je s malou asistencí a nebo se supervizí. Mezitím se objevují domácí spotřebiče s rozšířenou funkčností: Dnes jsme už navyklí na to, že automatická pračka vše zvládne sama, ale co třeba kuchyňský robot, který z větší části navaří sám? Vy si vyberete jídlo, on vám řekne co potřebuje za suroviny, kdy mu je máte dát - a většinu práce odvede za vás!