Преглед садржаја:
- Да бисте разговарали са човеком, притисните 0
- Апликације за лични телефон: Сири, Гоогле тренутно
- Тамо где ВР пада
- Шта будућност носи
Да ли сте икада звали компанију да вам помогне или да плати рачун, само да вас дочека пријатан снимљен глас који жели да разговара са вама - али не може да разуме ни пола онога што говорите? Или сте можда власник иПхоне-а, и док се Сири прво чинила као добар савезник, схватили сте да понекад (ОК, будимо искрени, често) она то једноставно не схвата? Технологија препознавања гласа (ВРТ), позната и као говор у текст, упада у заједничку замку: она има потенцијал да буде невероватно цоол (и дечко, је л 'се укоријенимо за то), али чешће је то прање зуба. вежба у фрустрацији.
Једном када је идеја која је припадала царству научне фантастике, препознавање гласа порасло од свог почетка 1950-их, када је систем Белл Лабораториес Аудреи дизајниран да препозна цифре изговорене једним гласом, у савремену мрежу конверзационе електронике са којом сада комуницирамо. свакодневно - са мешовитим резултатима.
Да бисте разговарали са човеком, притисните 0
Многа данашња предузећа данас користе системе зване интерактивни говорни одговор (ИВР) за обраду позива корисника. Најчешћа употреба је за меније са гласовном навигацијом, али неке компаније користе ИВР системе који могу приступити подацима о корисничком налогу и одговарати на мања питања. Софтвер менија ИВР обично има ограничен речник, који може бити ограничен на „да“, „не“ и бројеве. Сложенији системи могу препознати речи и фразе које су специфичне за компанију.
Ови системи постају све популарнији - барем за предузећа - из простог разлога: исплативи су. Према извештају из Валл Стреет Јоурнала за 2010. годину, типични позив купца који дође до агента кошта између 3 и 9 долара, док позив који се води преко аутоматизованог система кошта само пет до седам центи. И, наравно, рачунарски програми се не умарају, зову болесне или фрустрирају купце (мада купци сигурно постају фрустрирани њима!).
Срећом, то не значи да ИВР људима одузима посао - или барем да сви људи нестају из позивних центара. Ови помагачи који активирају глас омогућавају људским службама за кориснике да буду продуктивније усмеравањем позива и одговарањем на једноставна питања.
Наравно за људске кориснике који комуницирају са овим технологијама, није увијек глатко једрење. Технологија помаже у побољшању уобичајених проблема у технологији ИВР, као што су проблеми са акцентима, али отпуштање аутоматизованих система и даље је уобичајена тема на мрежи. Погледајте ову комедију о лифту опремљеном препознавањем гласа, који наглашава фрустрацију коју кварови у ИВР системима могу да произведу.
Апликације за лични телефон: Сири, Гоогле тренутно
Већина људи је упозната са препознавањем гласа за паметне телефоне. Иако већина најновијих модела телефона долази са ВР, њихова популарност - и ноторност - нагло је набрекао када је Аппле представио Сири, благо саркастичан, "лични асистент" који се активирао гласом за иПхоне 4С 2011. Гоогле је убрзо створио директног конкурента: Гоогле Сада за Андроид Јелли Беан ОС. Оба система имају женске гласове и софистициране функције препознавања које корисницима омогућавају да "разговарају" на својим телефонима користећи лежерни језик.
Али иако су ови системи знатно софистициранији и функционалнији од својих претходника, они такође показују да технологија још увек има дуг пут. Шале због Сиријиног неуспеха постале су популарна интернетска меме. Један човек је чак тужио Аппле за лажно оглашавање у вези са Сирииним могућностима.
Можда је зато, иако је Аппле створио Сири да би био напредан и информативан, ВР софтвер такође помало с прозрачне стране. На пример, ако говорите о једној од најзлогласнијих линија обавештајне технологије у историји кинематографије из филма из 1968. „2001: Свемирска одисеја“ - „отворите врата лежишта“ - Сири ће одговорити било линијом одговарања из филма, „ Жао ми је (ваше име), бојим се да не могу то учинити ", или још саркастичније, " ми, обавештајни агенти, очигледно то никада нећемо преживети. "
Позивање вас по имену само је једна од функција која покушава Сири олакшати љубав, а мало више људску. ВР асистент може пратити гласовне команде за упућивање позива, диктирање и слање текстова, интернетско тражење информација, проналажење продавница у близини, давање упутства за вожњу и још много тога, без потребе да било шта додирујете. Телефон истовремено говори и приказује се на екрану.
Гоогле Нов, ВР део Андроид Јелли Беан платформе, врло је сличан Сири. Систем нуди исте опсежне могућности препознавања преводећи повремени говор у команде које корисницима омогућавају позиве, слање текстова, покретање претрага, извршавање прорачуна и конверзија, грађење дефиниција речи, подешавање аларма, репродуковање песама и добијање мапа и упутстава.
За личне гласовне асистенте попут Сири и Гоогле Нов-а, предности су очигледне. Све, од позивања и слања порука до претраживања и забаве, брже је и лакше. Само реците шта желите и (већину времена) ВР апликација то прихвати за вас. Згодна технологија ВР-а посебно је корисна током вожње. И док су многи људи умањивали Сиријеве мане, а писци су тврдили да је способност Гоогле Нов-а да у основи води животе корисника обмањујућа и помало увредљива, већина људи и даље сматра да су ове футуристичке технологије прилично у реду.
Наравно, апликације за лични телефон попут Сири и Гоогле Нов нису далеко од савршених - иако заиста показују где би та технологија могла да се усмери у будућности. То значи да ћемо се чак и кад Сири покаже погрешан одговор, вероватно смејати и опростити јој, знајући да ће следећа верзија бити много боља.
Тамо где ВР пада
Ако сте икада наишли на ИВР када сте звали предузеће, можда сте приметили одређене препреке у комуникацији. Неки програми користе роботизирани глас у говору који погрешно изговара речи и отежава разумевање ствари. Други имају проблема са осетљивошћу због којих софтвер не може да обради оно што говорите ако сте превише гласни, премекани или не изговарате пажљиво.
Уз то, многи се и даље једноставно не осећају пријатно са машином. Ако покренете неколико претрага на ИВР-у, наићи ћете на спискове које су људи саставили на начин да заобиђу ИВР системе и стигну до „праве особе“. Ова решења се крећу у распону од „настави да притискаш 0 за оператера“ до „псовати у машини док не нађе човека“. Као резултат тога, велики део недавног развоја ИВР система врти се око тога што их чини укуснијим за људе; чинећи гласове симпатичнијим и мање роботским, чинећи систем лакшим за навигацију и омогућавајући позиваоцима да знају колико ће времена трајати од почетка до краја. То сугерише да је боља технологија овде само половина битке; друга половина омогућава корисницима да разговарају са машином.
Шта будућност носи
Упркос овим изазовима, технологија препознавања гласа стално се побољшава. Апликације попут Сири и Гоогле Нов-а - недостаци и све - и даље су изузетно импресивне у својим перформансама, а неколико компанија проширује ВР могућности на друге апликације.
На пример, Нуанце, творци Драгон НатураллиСпеакинг софтвера за говор-текст, већ су развили гласовне контроле за телевизоре и аутомобиле, а верзије ове технологије су уграђене у неке Самсунг ТВ-ове и СИНЦ забавни систем који се користе у одређеним Фордовим возилима.
И док Гоогле и Аппле настављају да проналазе нове намене за технологије препознавања гласа, вероватно ћемо све више разговарати са свим врстама свакодневних машина, од телевизора до тостера. И, још једном, изгледа да је научна фантастика била у праву. Само ћемо се надати да су ови паметни писци били у криву због једне ствари. Ако ове машине преузму, могли бисте бити у великој невољи следећи пут када замолите Сири да "отвори врата лежишта."