Кућа Аудио Коришћење ватрених људи: добијање пословне вредности од струјне аналитике: транскрипт вебинара

Коришћење ватрених људи: добијање пословне вредности од струјне аналитике: транскрипт вебинара

Anonim

Аутор особља Тецхопедиа, 24. фебруара 2016

Извлачење: Домаћин Ребецца Јозвиак разговара о аналитичким струјама с врхунским стручњацима у индустрији.

Тренутно нисте пријављени. Пријавите се или пријавите да бисте видели видео.

Ребецца Јозвиак: Даме и господо, здраво и добродошли у Хот Тецхнологиес 2016! Данашњи наслов је „Коришћење кријесница: Добивање пословне вриједности од Стреаминг Аналитицс“. Ово је Ребецца Јозвиак. Ја сам други за команданта за водитеља интернетских емисија кад год наш драги Ериц Каванагх не може бити овдје, па је лијепо видјети толико пуно вас данас вани.

Ова епизода се мало разликује од осталих. Некако смо разговарали о ономе што је вруће и наравно ове године је вруће. Последњих неколико година је било вруће. Увек излазе нове ствари. Данас говоримо о аналитичкој струји. Стреаминг аналитика је некако нова. Наравно стриминг, централни подаци, РФИД подаци, они нису нужно нови. Али у контексту архитектуре података, ми смо деценијама толико фокусирани на податке у мировању. Базе података, систем датотека, складишта података - све у највећој мери ради групне обраде. Али сада са помаком у стварању вредности од преноса података, емоција података, неки то називају живим токовима, заиста им је потребна архитектура заснована на струји, а не подаци у мировању архитектуре на које смо навикли и за које треба бити способна руковање брзим ингестијом, у стварном времену или близу обраде у стварном времену. Мора бити у стању да користи не само Интернет ствари, већ и Интернет свега.

Наравно, у идеалном случају било би лепо да две архитектуре живе једна поред друге, једна рука пере другу, да тако кажем. Иако подаци који се односе на дане, недељне податке, године старе податке и даље имају вредност, историјску аналитику, анализу трендова, то су живи подаци који покрећу живу интелигенцију ових дана и зато је стреаминг аналитике постао толико важан.

Данас причам више о томе. Имамо научника за податке, Дез Бланцхфиелд, који долази из Аустралије. За њега је рано јутро. Имамо нашег главног аналитичара, др Робина Блоор-а. Придружио нам се Ананд Венугопал, шеф производа за СтреамАналитик у Импетус Тецхнологиес. Они су стварно фокусирани на аспект аналитике у овом простору.

Са тим ћу ићи даље и проследити га Дез.

Дез Бланцхфиелд: Хвала. Морам да узмем контролу над екраном и искочим напред.

Ребека Јозвиак: Ево.

Дез Бланцхфиелд: Док ми хватамо слајдове горе, дозволите ми да само покренем срж теме.

Задржаћу га на високом нивоу и задржаћу га на отприлике 10 минута. Ово је врло велика тема. Учествовао сам у догађају у коме смо провели два до три дана дубински улазећи у детаље о томе шта је обрада токова и тренутни оквири које развијамо и шта би требало значити радити аналитику у тим великим количинама.

Само ћемо разјаснити шта мислимо помоћу струје аналитике, а затим ћемо истражити да ли се пословна вредност може извући јер то предузећа заиста траже. Они траже да им људи објасне веома брзо и сажето, одакле могу да добијем вредност применом неког облика аналитике на наше податке о стриму?

Шта је ток аналитике?

Стреаминг аналитика пружа организацијама начин да извуку вредност из података великих и великих брзина које долазе кроз посао у различитим облицима у покрету. Битна разлика овде је у томе што смо имали дугу историју развијања аналитике и сочива и погледа на податке које смо деценијама обрађивали у мировању откад је осмишљен маинфраме. Огромна промена парадигме коју смо видели у последње три до пет година, на ономе што називамо „веб локација“, упада у токове података који нам долазе у реалном времену или близу реалног времена, а не само обрађује и тражи корелацију догађаја или покретачи догађаја, али вршећи заиста детаљну, детаљну анализу на тим токовима. То је значајан помак према ономе што смо радили прије тога било прикупљање података, стављање у некакво спремиште, сада већ традиционално велике базе података, велики оквири великих података као што је Хадооп платформа и обављање батцх начина обраде на томе и добијање нека врста увида.

Врло смо добри у томе врло брзо и испробавали пуно тешког гвожђа, али још увек стварно прикупљамо податке, чувамо их, а затим гледамо и добијамо неке врсте увида или аналитике о томе. Прелазак на обављање те аналитике током преношења података био је сасвим ново и узбудљиво подручје раста за врсте ствари које се догађају око великих података. Потребан је потпуно другачији приступ само прикупљању, складиштењу и обради и извођењу аналитике.

Један од кључних покретача за помак и фокусирање на обављање аналитичких података у току је то што можете добити значајну пословну вредност тако што ћете те увиде добити брже и спремније како подаци стижу до вас, јер се информације стављају на располагање предузећу. Идеја да се сада ради на крају дана више није релевантна у одређеним индустријама. Желимо да можемо да радимо аналитику у лету. На крају дана, већ знамо шта се догодило као што се десило, а не да дођемо до краја дана и радимо 24-часовни групни посао и добијемо те увиде.

Стреаминг аналитика је управо упадање у тај ток, док су токови података обично вишеструки токови веома великих количина података и података који нам долазе у покрету врло, веома брзо и добијају увиде или аналитику о тим токовима док нам долазе насупрот. до омогућавања да то изађе у мировању и обављања аналитике на њима.

Као што сам напоменуо, имали смо деценијама и деценијама да радимо оно што ја зовем серијска анализа. Ставио сам овде стварно супер слику. Ово је слика господина који стоји испред ругавог рачунара који је креирала компанија РАНД Цорпоратион пре читавог живота и тако су изгледали као рачунар у кући. Оно што је занимљиво је да су чак и тада имали овај концепт свих тих малих бирања и ти бирање су представљале информације које долазе из куће и обрађују се у реалном времену и говоре вам шта се догађа. Једноставан пример је скуп барометријског притиска и температуре који можемо видети где гледамо шта се догађа у стварном времену. Али замишљам да је још тада, када је корпорација РАНД саставила тај мали модел, заправо већ размишљали о обради података и извршавању аналитике на њему док долази у формату струје. Нисам баш сигуран зашто су ставили волан на рачунар, али то је прилично у реду.

Од проналаска штампача, имали смо поглед на снимање података и провођење групне анализе на њима. Као што рекох сада са великим помаком и то смо видели по свирачима играча на веб скали који сви знамо, све су то кућни брендови попут Твиттера, Фацебоока и ЛинкедИна, интерактивног понашања које имамо са тим друштвеним платформе не захтевају само снимање, складиштење и обраду у батцх режиму, већ заправо снимање и покретање аналитике у лету из токова података који пролазе. Кад нешто кликнем, не само да их морају касније снимити и похранити, али морају и да га могу одмах вратити на мој ток и делити са другим људима који ме прате. То је модел серијске обраде.

Зашто бисмо се спустили овом рутом? Зашто би организације улагале вријеме, труд и новац чак и размишљајући о изазовима улагању на пут аналитике струјања? Организације имају ову огромну жељу да остваре повећање перформанси над својим конкурентима у индустријама у којима се налазе и да се добитак перформанси може брзо имплементирати једноставном аналитиком струјања и то може почети једноставним праћењем података у стварном времену које смо већ упознат са. Имам малу слику екрана Гоогле Аналитицс-а. Ово је вероватно један од првих случајева када смо заиста добили аналитику на нивоу потрошача. Тако да су људи посећивали вашу веб локацију и добијали бројање хит резултата, са ситним комадом ЈаваСцрипта на дну ваше веб странице у ХТМЛ-у уграђеном у вашу веб локацију, ови мали кодови су се у стварном времену враћали Гооглеу и били су вршећи анализу на оним токовима података који стижу са сваке странице на вашој веб локацији, сваког објекта на вашој веб локацији у стварном времену и враћају вам их на овој заиста слаткој малој веб страници на контролној табли графикона у стварном времену, слатким малим хистограмима и линијски граф који приказује Кс број људи који су историјски погодили вашу страницу, али ево колико их је тренутно тренутно.

Као што видите на снимку, тренутно пише 25. То је 25 људи управо у време када је снимак екрана био на тој страници. То је прва стварна шанса коју смо одиграли на алату за анализу потрошача. Мислим да је пуно људи то стварно схватило. Они су само разумели моћ сазнања шта се догађа и како могу да одговоре на то. Када помислимо на размере авионике, авиони који лете около, има само 18.700 домаћих летова дневно само у САД-у. Прочитао сам рад пре неког времена - било је то пре отприлике шест или седам година - да је количина података које су произвели ти авиони била око 200 до 300 мегабајта по старом инжењерском моделу. У данашњем дизајну авиона, ове летелице производе око 500 гигабајта података или око пола терабајта података по лету.

Када врло брзо направите математику са врха главе, 18.700 домаћих летова свака 24 сата у ваздушном простору САД-а, ако све модерне летелице производе око пола терабајта, то је 43 до 44 петабајта података који пролазе и дешава се док су авиони у ваздуху. То се дешава када слете и раде депоније. Тада улазе у радњу и одлазе од стране инжењерских тимова са пуним подацима како би погледали шта се догађа у лежајевима, точковима и моторима. Неки од тих података морају се обрађивати у реалном времену, тако да могу доносити одлуке о томе да ли је стварно проблем док је авион био у ваздуху или док је на земљи. Једноставно не можете то радити у пакетном режиму. У другим индустријама које видимо негде око финансија, здравства, производње и инжењерства, они такође гледају како могу да добију овај нови увид у оно што се догађа у стварном времену, за разлику од онога што се само складишти у базама података на термин.

Постоји и овај концепт бављења подацима као што називам покварљивим добрима или брзо покварљивом робом - да много података временом губи на вредности. То се све чешће догађа са апликацијама за мобилност и алатима за друштвене мреже јер оно што људи желе рећи и оно што је сада у тренду је оно на што желите да одговорите. Када размишљате о осталим деловима нашег живота са логистиком и испоруком хране около, ми разумемо концепт покварљиве робе у том смислу. Али размислите о подацима који пролазе кроз вашу организацију и вредности коју има. Ако неко тренутно обавља неке послове с вама и можете комуницирати с њима у стварном времену, не желите да сачекате сат времена како би се подаци могли снимити и ставити у систем као што је Хадооп, а затим притисните ово дугме, нећете моћи да се носите с тим тренутно и желите да то буде могуће на захтев клијента одмах. Постоји појам који ћете сада видети да ће се појавити пуно где људи разговарају о томе да имате у реалном времену ток података који вам може дати персонализацију и да се персонализација подешава у систему који користите према вашем личном искуству. На пример, када ударите на алат попут алата Гоогле Сеарцх, ако ја упитам, а ви учините исти упит, увек не добијамо тачне податке. Ми добијамо у основи оно што ја називам искуством славних. Третирам се једнократно. Ја добијам своју личну верзију онога што се дешава у овим системима на основу профила и података које су прикупили о мени и био сам у могућности да у реалном времену радим аналитику у току.

Ова идеја да су подаци покварљива роба за сада је стварна ствар, а вредност података која се временом смањује је нешто са чиме се данас морамо бавити. То није ствар јуче. Обожавам ову слику медведа који зграби лососа који скаче из реке, јер заиста слика управо оно што видим у аналитичкој струји. То је огромна река података која нам долази, ватрени оружје ако хоћете, а медвед сједи усред потока. Извршит ће аналитику у стварном времену на ономе што се догађа око ње тако да заправо може осмислити своју способност хватања те рибе у зраку. Није баш урањање у поток и хватање једног. Ова ствар скаче у ваздух и мора бити на правом месту у право време да би уловила ту рибу. У супротном не добија доручак или ручак.

Организација жели да учини исто са својим подацима. Они желе да извуку вредност из садашњих огромних количина података у покрету. Они желе да изврше аналитику тих података и података о великој брзини, тако да не долази само до количине података која нам долази, већ је брзина којом они долазе од њих. На пример, у безбедности су сви ваши рутери, прекидачи, сервери, заштитни зидови и сви догађаји који потичу са тих и десетине хиљада ако не и стотине хиљада уређаја, у неким случајевима подаци који су брзо покварљиви. Када размислимо о Интернету ствари и индустријском Интернету, говоримо о милионима ако не и милијардама сензора, а како подаци долазе путем којих се врши аналитика, ми сада гледамо на сложену обраду догађаја наређењем величине и брзине какве никада раније нисмо ни видели и са чиме ћемо се данас бавити. Морамо да направимо алате и системе око тога. То је прави изазов за организације, јер с једне стране имамо веома велике брендове који раде ДИИ, испеку их сами, када имају капацитет за то и вештине и инжењеринг. Али за просечну организацију то није случај. Немају сет вештина. Они немају ни капацитета ни времена, нити новца да уложе у то. Сви циљају на овај концепт доношења одлука у стварном времену.

Употријебите случајеве на које сам наишао и они су у сваком широком спектру сваког сектора који можете замислити, људи сједе и обраћају пажњу и говоре: како да примијенимо неке аналитичке податке на наше токове података? Говоримо о мрежним сервисима на мрежи. Постоје традиционалне платформе за друштвене медије и мрежни е-таилинг и трговина на мрежи - на пример, апликације. Сви они покушавају да нам пруже ово искуство познатих личности у стварном времену. Али када се упуштамо у више услуга технолошког скупа, телефонских услуга, гласа и видеа, видим људе како шетају радећи ФацеТиме на телефонима. Само експлодира. Смета ми што људи држе телефон испред себе и разговарају са видео стреамом пријатеља, за разлику од тога да га више држе за ухо. Али они знају да то могу и прилагодили су се и свидело им се то искуство. Развој ових апликација и платформа које их испоручују треба да извршавају аналитику у стварном времену на том саобраћају и на профилима саобраћаја, како би могли да извршавају једноставне ствари попут савршеног усмеравања видео снимка тако да квалитет гласа у видео који сте добили је адекватан за добро искуство. Не можете да обрађујете такве податке. Не би видео стреам у реалном времену постао функционална услуга.

Изазов управљања је у финансијским трансакцијама. Није у реду доћи до краја дана и сазнати да сте прекршили закон премештајући приватне податке по месту. У Аустралији имамо веома интересантан изазов где је премештање података везаних за приватност ван мора једноставно не. Не можете узети мој ПИД, моје приватне личне податке у иностранство. У Аустралији постоје закони који спречавају да се то догађа. Пружаоци финансијских услуга, посебно државне службе и агенције, морају да раде аналитику у стварном времену са својим токовима података и упутствима како би били сигурни да оно што ми пружају не напушта обале. Све ствари морају остати локално. Морају то да раде у реалном времену. Не могу прекршити закон и касније тражити опрост. Откривање преваре - прилично је очигледно за које чујемо код трансакција кредитним картицама. Али како се врсте трансакција које обављамо у финансијским услугама мењају веома, врло брзо, постоје разне ствари које ПаиПал сада прво ради на откривању преваре у реалном времену где се новац не креће од једне до друге ствари, али јесте финансијска трансакција између система. Платформе за лицитирање на Ебаиу, откривање преваре мора да се врши у реалном времену у канцеларији за стриминг.

Сада се креће тренд извођења активности екстракције и трансформације оптерећења у потоцима, тако да не желимо да снимимо ништа што иде на ток. То стварно не можемо. Људи су научили да подаци воле да се брзо руше ако снимимо све. Трик је сада у томе да извршите аналитику на тим токовима и направите ЕТЛ на њој и само снимите оно што вам треба, потенцијално метаподате податке, а затим возите предиктивну аналитику тамо где ми заправо можемо рећи шта ће се догодити мало даље низ стазе о ономе што ми Управо сам видео у току на основу аналитике коју смо извршили на основу тога.

Добављачи енергије и комуналија доживљавају ову огромну жељу потрошача да цене цене потражње. Могао бих да одлучим да желим да купим зелену струју у одређено доба дана јер сам само код куће и не користим пуно уређаја. Али ако имам вечеру, можда бих желео да сви моји уређаји буду укључени и не желим да купујем јефтину струју и чекам да је испоруче, али вољан бих да платим више трошкова да би је добио. Ова цена тражења, посебно у комуналном и енергетском простору, већ се догодила. Убер је, на пример, класичан пример ствари које можете радити сваки дан и све је вођено ценама потражње. Постоје неки класични примери да људи у Аустралији узимају цене 10.000 долара због велике потражње у новогодишњој ноћи. Сигуран сам да су се бавили тим проблемом, али аналитика струје се врши у стварном времену док сте у аутомобилу говорећи вам колико бих требао платити.

Интернет ствари и сензорски токови - само смо огребали по површини и стварно смо се само разговарали о томе, али видећемо занимљив помак у томе како се технологија бави тиме, јер када говорите не отприлике хиљаде или десетине хиљада, али стотине хиљада и потенцијално милијарде уређаја који долазе на вас, скоро ниједан технолошки низ који сада имамо није дизајниран да се носи са тим.

Постоје неке заиста вруће теме које ћемо видети свуда око нас, као што су безбедност и цибер ризик. Они су за нас врло стварни изазови. На интернету постоји заиста уредан алат назван Сјевер, гдје можете сједити и гледати на веб страници разне цибератне нападе у стварном времену. Када га погледате, мислите да је „ох то симпатична мала веб страница“, али након отприлике пет минута унутра, схватили сте количину података које систем врши аналитиком на свим различитим токовима свих различитих уређаја широм света. која се у њих храни. Почиње да вам замагљује ум како то уопште изводе на ивици снимка и пружа вам једноставан мали екран који вам говори шта или нешто друго нападате у стварном времену и које врсте напада. Али то је заиста уредан мали начин да само стекнете добар укус онога што аналитика струје потенцијално може учинити за вас у стварном времену тако што ћете само гледати ову страницу и схватити само количину и изазов преузимања струјања, обраде аналитичких упита о њих и представљајући то у реалном времену.

Мислим да ће разговор који имам током остатка сеансе бавити свим тим стварима са једним занимљивим погледом, са мог угла, и то је изазов ДИИ-а, испекујте га сами, одговара неком од класични једнорози који су у стању да себи приуште да граде такве врсте ствари. Они имају милијарде долара за изградњу ових инжењерских тимова и за изградњу њихових податковних центара. Али за 99, 9% тамошњих организација које желе да повећају вредност у свом послу аналитике струјања, треба да добију неовисну услугу. Они морају да купе производ ван кутије и обично им је потребна нека консултантска услуга и професионална услуга која ће им помоћи да га спроведу и ту вредност добију назад у послу и продају га као пословно решење.

С тим се враћам, Ребека, јер верујем да ћемо то сада детаљно покрити.

Ребека Јозвиак: Одлично. Хвала вам пуно, Дез. То је сјајна презентација.

Сада ћу проследити лопту Робину. Однеси то.

Робин Блоор: У реду. Пошто је Дез упао у гнојну мрљу токова обраде, изгледало ми је да нема смисла поново то покривати. Само ћу заузети потпуно стратешки став. Гледајући готово с врло високог нивоа на оно што се дођавола догађа и позиционирати га јер мислим да би то могло помоћи људима, посебно нама људима који раније нису утаборени у токове који обрађују на великој дубини.

Обрада токова је већ дуго присутна. Некада смо га звали ЦЕП. Пре тога је постојао систем у реалном времену. Оригинални системи за контролу процеса заправо су обрађивали токове информација - наравно да ништа није ишло тако далеко као данас. Ова графика коју видите на дијапозитиву овде; заправо указује на много ствари, али указује изнад и изван свега осталог - на чињеницу да овде постоји спектар латенција које се појављују у различитим бојама. Оно што се заправо догодило од проналаска рачунара или комерцијалног рачунања који је стигао тачно око 1960. године јесте да је све текло све брже и брже. Некада смо могли да зависимо од начина на који ће то заиста изаћи ако желите у таласима, јер тако то изгледа. То заправо зависи од тога. Будући да је све управљало Моореовим законом и Моореов закон би нам дао фактор од око десет пута брже у периоду од око шест година. Онда, кад смо заправо стигли до 2013. године, све се покварило и одједном смо почели убрзавати брзином којом никад нисмо, што је необично без преседана. Добијали смо фактор од око десет у смислу повећања брзине, а самим тим и смањења кашњења отприлике сваких шест година. У шест година од отприлике 2010, имамо више од најмање хиљаду. Три величине више него један.

То је оно што се догађа и зато се чини да се индустрија на овај или онај начин креће фантастичном брзином - јер јесте. Управо пролазећи кроз значење ове конкретне графике, времена одзива заправо су она у алгоритамској скали низ вертикалну осовину. Реално време је брзина рачунара, бржа од људских бића. Интерактивна времена су наранџаста. У тренутку када комуницирате са рачунаром, тамо желите да задржите десетину до отприлике једну секунду кашњења. Изнад, постоји трансакција у којој ми заправо размишљамо о ономе што радите у рачунару, али ако то нестане за петнаест секунди, постаје неподношљиво. Људи заправо само неће чекати рачунар. Све је урађено у шаржи. Много ствари које су урађене у пакету сада се спуштају право у трансакциони простор, право у интерактивни простор или чак у простор у стварном времену. Док смо претходно, талас са врло малим количинама података могли нешто да урадимо од овога, сада можемо да урадимо и са веома великим количинама података користећи изузетно умањено окружење.

У основи, све ово говори да су заиста времена трансакције и интерактивне људске реакције. Страшно пуно онога што се тренутно ради са струјањима је информисање људи о стварима. Неке од њих иде брже од тога и добро обавештавају ствари тако да је у стварном времену. Тада узимамо дозволу да само паднемо попут камена, чинећи тренутну анализу изводљивом и случајно сасвим приступачном. Није се само смањила брзина, већ се и врх срушио. Вероватно највећи утицај на све ове међу свим разним апликацијама, можете урадити све ове предиктивне анализе. Рећи ћу ти зашто за минут.

Ово је само продавница хардвера. Имате паралелни софтвер. Говоримо о 2004. години. Архитектура скалирања, мултицоре чипови, повећање меморије, подесив ЦПУ. ССД дискови сада иду много брже од окретања диска. Можете прилично да се поздравите са диском који се окреће. ССД дискови се такође налазе у више језгара, тако да су опет бржи и бржи. Ускоро ћемо се појавити, добили смо мемориал од ХП-а. Добили смо 3Д КСПоинт од Интела и Мицрона. Обећање оних је да ће ионако све ићи брже и брже. Када заправо размишљате о две нове меморијске технологије, које ће обе учинити целог основног малог дела, појединачна штампана плоча иде брже, чак нисмо видели ни крај томе.

Стреамс технологија, која је заиста следећа порука, је ту да остане. Мораће да постоји нова архитектура. Мислим, Дез је то већ споменуо у неколико тачака у свом излагању. Десетљећима смо архитектуру доживљавали као комбинацију скупова података и цијеви података. Тежили смо да обрађујемо хрпе и тежили смо да податке преносимо између група. Сада се темељно крећемо ка ономе што називамо Ламбда архитектура података која комбинује обраду протока података са групама података. Када заправо обрађујете ток догађаја који долазе против историјских података као проток података или гомила података, то мислим на Ламбда архитектуру. Ово је у повојима. То је само део слике. Ако сматрате нешто тако сложеним као Интернет свега, што је Дез такође споменуо, заправо ћете схватити да постоје различите врсте проблема са подацима о локацији - одлуке о томе шта бисте требали обрадити у току.

Оно што овде стварно кажем је да смо, када смо обрађивали у пакету, заправо обрађивали токове. Једноставно не бисмо могли једно по једно. Само чекамо док се не нађе велика хрпа ствари и онда све обрадимо одједном. Прелазимо у ситуацију у којој заправо можемо да обрађујемо ствари у току. Ако можемо да обрадимо ствари у току, тада ће копије података које држимо бити статични подаци које требамо навести да бисмо обрадили податке у току.

Ово нас води до ове посебне ствари. То сам већ поменуо у неком излагању са биолошком аналогијом. Начин на који бих волео да размишљате је у овом тренутку када смо људи. Имамо три различите мреже за предиктивну обраду у реалном времену. Називају их соматским, аутономним и ентеричким. Ентеријер вам је желудац. Аутономни нервни систем брине за борбу и за летове. Заправо брине о брзим реакцијама на околину. Соматичка која пази на померање тела. То су системи у реалном времену. Занимљивост у вези тога - или мислим да је некако занимљива - јесте да је много тога предиктивније него што бисте икада замислили. Као да заправо гледате екран на око 18 центиметара од вашег лица. Све што јасно можете видети, све што ваше тело може јасно видети је заправо у правоугаонику величине 8 × 10. Све што је изван тога заправо је замагљено што се тиче вашег тела, али ваш ум заправо попуњава празнине и чини да не буде мутно. Уопште не видите замућење. То јасно видите. Ваш ум заправо ради предиктивну методу протока података да бисте видели ту јасноћу. То је помало знатижељна ствар, али заправо можете сагледати начин на који живчани систем функционише и начин на који успевамо да се снађемо и понашамо се разумно - барем неки од нас - разумно здраво и не налетимо на ствари све време.

Све је урађено низом скала неуронске анализе овде. Оно што ће се догодити је да ће организације имати исту врсту ствари и да ће изградити исту врсту ствари, а то ће бити обрада токова, укључујући унутрашње токове организације - ствари које се дешавају унутар оно, ствари које се дешавају изван њега, тренутни одговори који заправо морају бити донети, наравно, хране човека да доноси одлуке, да би се све то догодило. Тамо идемо, колико видим.

Једна од ствари која је последица тога је да ниво апликације за стриминг иде добро. Биће много више него што то сада видимо. Управо у овом тренутку смо убирејући плодове нејасних ствари које раде очигледне ствари.

Дакле, свеједно је овде закључак. Стреаминг аналитика некада је ниша, али постаје главна и ускоро ће бити усвојена.

С тим путем, вратит ћу га Ребеки.

Ребека Јозвиак: Пуно хвала, Робин. Одлична презентација, као и обично.

Ананд, ти си следећи. Спрат је твој.

Ананд Венугопал: Фантастично. Хвала вам.

Моје име је Ананд Венугопал и руководила сам производу за СтреамАналитик. То је производ који нуди Импетус Тецхнологиес, ​​из Лос Гатоса у Калифорнији.

Импетус је заправо имао сјајну историју у томе што је био добављач великих података за велика предузећа. Дакле, направили смо бројне имплементације струјног аналитичког пословања као услужне компаније и научили смо много лекција. Такође смо прешли у компанију која се бави производима и предузеће које се заснива на решењима у последњих неколико година, а аналитика струјања прелази на терет трансформације Импетуса у компанију која је у великој мери заснована на производима. Постоје неке критичне, врло, врло кључне имовине које је Импетус очистио захваљујући излагању нашим предузећима, а СтреамАналитик је једно од њих.

Послујемо 20 година у послу и постоји сјајна комбинација производа и услуга што нам чини огромну предност. А СтреамАналитик је рођен из свих научених лекција из наших првих пет или шест имплементација стриминга.

Ја ћу се дотакнути неколико ствари, али аналитичари, Дез и Робин, урадили су фантастичан посао у покривању простора у цјелини, тако да ћу прескочити пуно садржаја који се преклапа. Вероватно ћу брзо ићи. Поред истинских случајева стреаминга видимо и мноштво правих акцелерација серије код којих у предузећима постоје буквално веома, врло важни батцх процеси. Као што видите, цео овај циклус осећања неког догађаја и његове анализе и деловања на њему могао би потрајати недељама у великим предузећима и сви они га покушавају смањити на неколико минута, а понекад и секунди и милисекунди. Дакле, све брже од свих ових процеса су кандидати за пословно стицање и то је врло добро речено да се вриједност података драматично смањује с годинама, тако да је већа вриједност у почетном дијелу у секунди у којој се то управо догодило. У идеалном случају, ако можете предвидјети шта ће се догодити, то је највећа вриједност. То ипак зависи од тачности. Следећа највећа вредност је кад се она тамо налази, кад се дешава, можете је анализирати и одговорити. Наравно, вредност се драматично смањује након тога, главног рестриктивног БИ-а у којем се налазимо.

То је занимљиво. Можете очекивати драматично научни одговор на питање зашто струји аналитику. С многим случајевима оно што видимо је зато што је то сада могуће и зато што сви знају да је серија стара, шаржа је досадна, а серија није цоол. Доста је било образовања који су сви имали сада о чињеници да је могуће струјање и сви имају Хадооп сада. Сада Хадооп дистрибуције имају уграђену технологију за стриминг, било да је у питању Сторм или Спарк стреаминг и наравно редови порука, попут Кафке, итд.

Предузећа која видимо скачу у то и почињу експериментирати са овим случајевима и видимо две широке категорије. Једна има везе са аналитиком корисника и искуством корисника, а друга оперативном интелигенцијом. Ја ћу се позабавити неким детаљима о томе нешто касније. Целокупна корисничка служба и купац искуство, а ми у Импетус СтреамАналитик-у то смо радили на много различитих начина, заиста је све заиста, заиста ухваћајући вишеканално ангажовање потрошача у стварном времену и пружајући им врло, врло контекстодивно искуство које данас нису уобичајене. Ако прегледавате веб, веб локацију Банк оф Америца и истраживали сте неке производе и једноставно назовите цалл центар. Да ли би рекли: „Хеј Јое, знам да сте истраживали неке банкарске производе, да ли бисте желели да вас испуним?“ Не очекујете то данас, али то је врста искуства која је заиста могућа са струјним аналитикама. У многим случајевима то чини велику разлику, поготово ако је клијент започео истраживање начина како да изађе из уговора с вама гледајући клаузуле о раном раскиду или одредбе и одредбе за рани раскид на вашој веб локацији, а затим се јавите и ви сте у могућности да то не учините директно им се суочити око тога, али само индиректно понудити понуду за неку врсту прве промоције, јер систем зна да та особа гледа на превремени раскид, а ви ту понуду направите у том тренутку, ви бисте то врло добро могли да заштитите од купца који штити и заштити то средство .

То би био један пример, плус много корисничких услуга све су добри примери. Данас имплементирамо смањује трошкове у цалл центру као и пружа драматично угодно искуство купцима. Дез је обавио сјајан посао у сажетку неких случајева употребе. Можете да зурите у овај графикон неколико минута. Класифицирао сам га као вертикале, хоризонталне и комбиниране области, ИоТ, мобилне апликације и позивни центар. Све су вертикалне и хоризонталне. Зависи како посматрате. У наставку, видимо доста хоризонталних употреба које су прилично уобичајене за вертикалне индустрије и постоје случајеви специфичне вертикалне употребе, укључујући финансијске услуге, здравство, телеком, производњу итд. Ако се заиста постављате себи питање или кажете себи да, „ох, не знам који су случајеви употребе. Нисам сигуран да ли заиста има неке пословне вредности у струји аналитике за моју компанију или за наше предузеће, “добро размислите, размислите два пута. Разговарајте са више људи јер постоје случајеви употребе који су данас у вашој компанији релевантни. Упознаћу пословну вредност о томе како се тачно изводи пословна вредност.

На дну пирамиде овде имате предвидљиво одржавање, сигурност, заштиту од пепела итд. Те врсте примене представљају заштиту прихода и имовине. Да је Таргет заштитио њихово кршење сигурности који се догађао сатима и недељама, ЦИО је могао да спаси његов посао. То би могло уштедјети десетине или стотине милиона долара, итд. Стреаминг аналитика у стварном времену заиста помаже у заштити те имовине и заштити губитака. То је директна додата вредност.

Следећа категорија постаје профитабилнија, смањује трошкове и остварује више прихода од тренутног пословања. То је ефикасност тренутног предузећа. Све су то случајеви употребе које називамо оперативном интелигенцијом у стварном времену где добијате дубоки увид у то како се мрежа понаша, како се понашају ваши клијенти, како се понаша ваш пословни процес и да ли сте у могућности прилагодити се све то у реалном времену јер добијате повратне информације, добијате обавештења. Добијате одступања, одступања у стварном времену и можете брзо да делујете и одвајате процес који излази ван границе.

Такође бисте могли уштедети много новца у скупој надоградњи капитала и стварима за које мислите да су неопходне, а које можда неће бити потребне ако сте оптимизовали мрежни сервис. Чули смо за случај када је главни телцо одложио 40 милиона долара надоградње у својој мрежној инфраструктури, јер су открили да имају довољан капацитет за управљање својим тренутним прометом, што је оптимизирањем и бољим обављањем интелигентног усмеравања свог промета и сличних ствари. Све су то могуће само уз помоћ аналитике и механизма акције у стварном времену који делује на те увиде у реалном времену.

Следећи ниво додате вредности је уп-селл, цросс-селл где постоје могућности да се заради више прихода и профита од тренутне понуде. Ово је класичан пример који многи од нас знају о томе где су доживели, о чему размишљате у свом животу где сте данас заправо спремни купити производ који вам се не нуди. У многим, многим случајевима се то заправо и догађа. Имате на уму ствари које волите да купујете, а знате да желите да купите, да имате листу обавеза или нешто слично, што вам је рекла супруга или ако немате жену, али сте стварно желели да купите и идете или у куповину на веб локацији или комуницирате у малопродаји, само место трговине нема контекст, нема интелигенцију да израчуна шта вам може требати. Дакле, они не могу да осигурају посао. Ако би се стреаминг аналитика могла применити да би се заиста прецизно предвидјела и која су заиста могућа у ономе што би највише одговарало овом конкретном контексту, овај купац у овом тренутку на овој локацији, постоји много уп-продаја и цросс-селл-а, а то опет долази од струјна аналитика - могућност доношења одлуке о склоности шта ће овај купац вероватно купити или одговорити у том тренутку истине када за то постоји прилика. Зато волим ону слику коју је Дез показао медведу који је управо требао јести ту рибу. То је готово све.

Такође мислимо да постоји велика категорија драматичних, трансформационих промена у предузећу која нуде потпуно нове производе и услуге једноставно засноване на проматрању понашања купаца, а све засновано на посматрању понашања другог предузећа. Ако, рецимо, телцо или кабловска компанија стварно поштују обрасце коришћења купаца у ком сегменту тржишта које он гледа, који програм у које време итд., Они заправо завршавају стварањем производа и услуга о којима се готово моли јер на неки начин. Дакле, цео концепт понашања на више екрана управо тамо где га сада готово схватамо да можемо да гледамо ТВ или кабловски садржај на нашим мобилним апликацијама. Неки од тих примера потичу из нових производа и услуга који нам се нуде.

Укључићу се у „Која су архитектонска својства струјне аналитике?“ То је коначно оно што покушавамо да учинимо. Ово је Ламбда архитектура у којој спајате историјске податке и увиде у стварном времену и истовремено их видите. То Сигма омогућава. Сви данас имамо серијску архитектуру и слику предузећа. Гледамо у неку врсту БИ стака и употребног скупа и додана је Ламбда архитектура. Како је слој брзине или потреба и Ламбда све у томе да споји та два увида и то схвати на комбиновани начин, на богат начин који комбинује оба увида.

Постоји још једна парадигма која се зове архитектура Каппе која се предлаже где се претпоставља да је брзински слој једини улазни механизам који ће дугорочно постојати. Све ће проћи кроз овај слој брзине. Не постоји чак ни механизам ван мреже ЕТЛ. Све ЕТЛ ће се догодити. Чишћење, чишћење података, квалитетан ЕТЛ - све се то догађа на жици, јер имајте на уму да су сви подаци рођени у реалном времену. У неком тренутку било је реално време. Толико смо се навикли да ово стављамо на језера, на реке и океане, а онда то радимо на статичкој анализи да смо заборавили да су подаци рођени у неком тренутку у стварном времену. Сви подаци су заправо рођени као догађаји у стварном времену који су се догодили у одређеном тренутку и већина данашњих података о језеру управо је стављена у базу података за каснију анализу и ми сада имамо предност у Ламбда и Каппа архитектури видевши га, анализирајући га, унапред га обрађујући и реагујући на њега док стигне. То је оно што ове технологије омогућавају. Када посматрате то као укупну слику, изгледа отприлике овако где је Хадооп унутра, постоје МПП-ови и складишта података која већ имате.

Ми то постављамо зато што је важно не говорити само о новим технологијама на острву. Морају да се интегришу. Они морају имати смисла у тренутном контексту предузећа, и као пружаоци решења који опслужују предузећа, ми смо на ово веома осетљиви. Помажемо предузећима да интегришу целу ствар. Постоје извори података са леве стране који се хране и у Хадооп и слојеве складишта података, као и у реалном времену на врху, а сваки од тих ентитета су рачунари са залихама као што можете видети, а слој потрошње података је са десне стране страна. Непрестани напори су да се помакне већина усклађености, управљања, безбедности, управљања животним циклусом итд., Које су данас доступне, а све су то спојене у ову нову технологију.

Једна од ствари коју аналитичка струја покушава да уради, ако данас погледате пејзаж, у пејзажној технологији струје се догађа много ствари и са становишта клијента, толико је тога за разумети. Постоји толико тога за наставити. На левој страни постоје механизми за прикупљање података - НиФи, Логстасх, Флуме, Скооп. Очигледно сам ставио изјаву о одрицању одговорности рекавши да није исцрпна. Долазите у редове порука и затим улазите у опен-соурце стреаминг моторе - Олуја, Спарк Стреаминг, Самза, Флинк, Апек, Херон. Херон вероватно још није отворени извор. Нисам сигуран да ли је то са Твиттера. Ти стриминг мотори затим воде или подржавају компоненту аналитичке компоненте за подешавање као што су сложена обрада догађаја, машинско учење, предиктивна аналитика, модул упозоравања, струјање ЕТЛ-а, филтри за статистику обогаћивања. То су све оно што сада називамо оператерима. Скуп тих оператора када се повезују заједно, потенцијално би такође био уобичајен закључак који би се у великој мери закључио, ако је потребно, апликација за стриминг која се покреће на стреаминг енгине-у.

Као део тог ланца компоненти такође морате чувати и индексирати податке у своју омиљену базу података, свој омиљени индекс. Можда ћете такође морати да дистрибуирате кеш меморију која води у слој за визуелизацију података на десној страни на горњем делу до комерцијалних производа или производа отвореног кода, али на крају вам је потребан некакав производ да бисте те податке визуализовали у реалном времену. Такође, понекад морате смислити и друге апликације. Сви смо видели да вредности добијене само акцијом коју преузмете на увид, да ће акција бити окидач од аналитичког скупа у други сноп апликација који се можда променио то је нешто на страни ИВР или покреће позивни центар одлазни позив или нешто слично. Морамо имати интегрисане те системе и неки механизам да ваш стриминг кластер покреће остале апликације за слање података низводно.

То је укупна гомила од преласка с лева на десно. Затим имате сервисне слојеве, средњи надзор, ниво општег сервисног осигурања итд. Долазите до производа који се налазе у пословном простору који купци виде као Хадооп дистрибуције које све струје као што сам рекао и постоје комерцијалне или појединачне -вендор решења која су очигледно у нашим конкурентима. Такође у пејзажу има много више које можда овде нисмо споменули.

Оно што тамо видите углавном види и корпоративни корисник. Као што видите, сложен и брзо развијајући се пејзаж технологије за обраду токова. Морамо да поједноставимо избор и њихово корисничко искуство. Оно што мислимо да је предузећима заиста потребно функционално је апстрахирати све то у једном месту, једноставном интерфејсу који спаја све те технологије које га чине једноставним за употребу и не излаже све покретне делове и питања деградације и питања перформанси и питања одржавања животног циклуса у предузећу.

Апстракција функционалности је једна. Други део је апстракција струјног мотора. Мотори струје и домени отвореног кода појављују се једном у три, четири или шест месеци. Дуго је била Олуја. Самза се појавио и сада је то Спаркинг Стреаминг. Флинк подиже главу, почињући да привлачи пажњу. Чак и путоказ за Спарк Стреаминг, они стварају начин да потенцијално користе други мотор за чисту обраду догађаја, јер они такође схватају да је Спарк дизајниран за серију и стварају пут у својој архитектонској визији и њиховом плану за потенцијално другачији приступ мотор за обраду токова поред тренутног микробатцх-а у Спарк Стреаминг-у.

То је реалност са којом се морате суочити да ће бити доста еволуције. Заиста се морате заштитити од тог тока технологије. Јер по дефаулту ћете морати да га одаберете, а затим да живите с њим, што није оптимално. Ако гледате на други начин, борите се између, "ок, морам да купим власничку платформу на којој нема закључавања, нема полуге отвореног кода, може бити веома велика цена и ограничена флексибилност наспрам свих ових скупова отворених кода тамо где морате сами да радите. “Поново, као што рекох, то кошта много трошкова и кашњења у приступу тржишту. Оно што ми кажемо да је СтреамАналитик један пример сјајне платформе која обједињује пословну класу, поуздан, појединачни добављач, подржану професионалну услугу - све оно што вам је као предузеће заиста потребно и снагу флексибилности екосистема отвореног кода где их обједињује једна платформа - Ингест, ЦЕП, аналитика, визуализација и све то.

То такође чини врло, врло јединствену ствар, која обједињује много различитих технологија мотора испод једног корисничког искуства. Заиста мислимо да је будућност у томе да можемо користити више стреаминг мотора јер различити случајеви употребе заиста захтевају различите струјне архитектуре. Као што је Робин рекао, постоји читав спектар латенција. Ако заиста говорите о нивоу кашњења милисекунди, десетинама или чак стотинама милисекунди, заиста вам је потребна Олуја у овом тренутку док не буде неки други једнако зрели производ за мање попустљивости или блажи временски оквир и латенције можда за пар секунди, три, четири, пет секунди, у том распону, тада можете користити Спарк Стреаминг. Потенцијално постоје други мотори који могу радити и једно и друго. Дно црта, у великом предузећу, користиће се све врсте случајева. Заиста желите да приступ и опћенитост имају више мотора са једним корисничким искуством и то је оно што покушавамо да изградимо у СтреамАналитику.

Само брз преглед архитектуре. Ово ћемо мало прерадити, али у суштини, на левој страни долази више извора података - Кафка, РаббитМК, Кинесис, АцтивеМК, сви ти извори података и редови порука долазе на платформу за обраду токова где морате да саставите апликацију, где морате да повлачите и испуштате од оператора попут ЕТЛ-ова, све ствари о којима смо разговарали. Испод је неколико мотора. Тренутно имамо Сторм и Спарк Стреаминг као јединствену индустријску платформу и прву платформу за стриминг предузећа која има вишеструку подршку мотора. То је врло јединствена флексибилност коју нудимо поред све остале флексибилности контролних плоча у реалном времену. Уграђен је ЦЕТ мотор. Имамо беспрекорну интеграцију са Хадооп и НоСКЛ индексима, Солр и Апацхе индексима. Можете слетјети у своју омиљену базу података без обзира о чему се ради и правити апликације заиста брзо и брзо доћи на тржиште и остати доказ будућности. То је наша цела мантра у СтреамАналитику.

С тим мислим да ћу закључити своје примедбе. Слободно нам се обратите за више питања. Желио бих да ријеч остане отворена за питања везана за питања и питања и панел дискусију.

Ребека, за тебе.

Ребека Јозвиак: Сјајно, добро. Хвала Вам много. Дез и Робин, да ли имате неких питања пре него што их пребацимо на питања и питања публике?

Робин Блоор: Имам питање. Ставит ћу слушалице да ме чујете. Једна од занимљивих ствари, ако ми то можете љубазно рећи, много онога што сам видео у отвореном простору изгледа оно што бих рекао незрело за мене. У одређеном смислу, да, можете да радите разне ствари. Али чини се да у стварности гледамо на софтвер у његовом првом или другом издању и само сам се питао из вашег искуства као организације, колико сматрате незрелост Хадооп окружења проблематичном или је то нешто што нема ' не стварам превише проблема?

Ананд Венугопал: То је стварност, Робин. Апсолутно си у праву. Незрелост није нужно у подручју само функционалне стабилности и ствари, али можда су такви и случајеви. Али незрелост је више у спремности за употребу. Производи отвореног кода како излазе, а чак и док их нуди дистрибуција Хадооп, сви су они пуно различитих способних производа, компоненти које су спојене заједно. Они не раде без проблема и нису дизајнирани за глатко и несметано корисничко искуство које ћемо добити попут Банк оф Америца или Веризон или АТ&Т, да бисмо применили апликацију за аналитику за стриминг у року од неколико недеља. Нису сигурно дизајнирани за то. То је разлог због чега ми улазимо. Ми то спајамо и олакшавамо разумевање, постављање итд.

Мислим да је функционална зрелост тога у великој мери присутна. Многа велика предузећа данас користе на пример Олују. Многа велика предузећа се данас играју са Спарк Стреамингом. Сваки од ових мотора има своја ограничења у ономе што могу радити, зато је важно знати шта можете, а шта не можете са сваким мотором и нема смисла разбијати главу о зид и говорити: „Гледај ја изабрао је Спарк Стреаминг и то ми не функционира у овој одређеној индустрији. "Неће успети. Биће кориштени случајеви у којима ће искрење бити најбоља опција, а постојаће случајеви где Спаркинг Стреаминг можда неће радити код вас. Због тога вам је заиста потребно више опција.

Робин Блоор: Па, за већину тога требате имати стручне тимове. Мислим, чак ни не знам одакле бих започео. Разумна сарадња квалификованих појединаца. Занима ме како се ангажман у који сте укључени и како се дешава. Да ли је то зато што се одређена компанија налази након одређене апликације или видите неку врсту онога што бих назвао стратешким усвајањем тамо гдје желе да читава платформа уради много ствари.

Ананд Венугопал: Робе видимо примере и једног и другог. Неке од првих десет марки које сви знају раде о томе на врло стратешки начин. Они знају да ће имати разне случајеве употребе, па процењују платформе које ће одговарати тој потреби, а то је мноштво различитих случајева употребе на начин који ће бити мулти-станар који ће бити распоређени у предузећу. Постоје и приче о једнократној употреби које такође почињу. У хипотекарној компанији на којој радимо постоји посебан случај праћења пословне активности праћења пословне активности, који не бисте замислили као случај прве употребе, али то је пословно решење или случај коришћења који су смислили и затим смо тачке повезали у стриминг . Рекли смо: "Знате шта? Ово је сјајан случај за стреаминг аналитике и на овај начин је можемо имплементирати. “Тако је и почело. Затим се у том процесу едукују и кажу: „Ох вов, ако то можемо учинити и ако је ово генеричка платформа, онда можемо одвојити апликацију, слојити их у платформу и изградити много различитих апликација на овом платформа. "

Робин Блоор: Дез, имаш ли каквих питања?

Ананд Венугопал: Дез је вероватно без звука.

Дез Бланцхфиелд: Извињење, нем. Само сам добро обавио разговор. Ако пратите оригинално запажање Робина, потпуно сте у праву. Мислим да је изазов сада да предузећа имају екосистем и културно и бихевиорално окружење где је бесплатни софтвер са отвореним кодом нешто што им је познато и они могу да користе алате попут Фирефока као прегледач и имају пристојан приступ животни век док не постане стабилан и сигуран. Али неке од тих веома великих платформи које користе су власничке платформе за предузећа. Дакле, усвајање оног што сматрам платформама отвореног кода није увек нешто што им је лако да се културолошки или емоционално преброде. То сам видео тек усвајањем малих програма који су били локални пројекти који се једноставно играју са великим подацима и аналитиком као основним концептом. Мислим да је један од кључних изазова, сигуран сам да сте их сада видели широм организација, њихова жеља да добију исход, али истовремено имају и једну ногу заглављену у стару конзерву, одакле могу ово само купити "Уметните велики бренд" Орацле, ИБМ и Мицрософт. Ови нови и познати брендови долазе с Хадооп платформама и још више. Долазе узбудљивији брендови преко којих поседује врхунску технологију попут стреам.

Које сте врсте разговора водили или пресекли кроз то? Знам да јутрос имамо масовно присуство и једна је ствар за коју сам сигуран да свакоме пада на памет: „Како да пребацим цео овај изазовни слој од даске до нивоа управљања, ох, то је превише опен соурце и превише крвавог руба? "Како пролазе разговори са клијентима и како се пробијате до те тачке где некако ублажавате те врсте страхова да размислите о усвајању симпатије СтреамАналитика?

Ананд Венугопал: Заправо нам је прилично лако продати предлог вредности јер купци природно крећу ка отвореном извору као преферираној опцији. Лако се одричу и говоре: „У реду, сада идем на отворени код.“ Они заправо пролазе кроз веома посвећену процену великог производа, рецимо да је то ИБМ или типичан производ, јер они имају ове везе између добављача. Не би поступали с нама ни с отвореним кодом према том производу. Проћи ће кроз шест до осам до дванаест недеља евалуације. Убедити ће се да овде постоји одређени степен перформанси и стабилности који желе да наставе, а онда се одлучују говорећи: „Вау, знаш шта, ја у ствари то могу да учиним.“

Данас, на пример, имамо главни телцо ниво једног нивоа који има аналитику струјања која се покреће у производњи поврх великог броја гомила и они процењују то против другог веома, веома великог познатог продавца и у то су се уверили тек након што смо доказали све перформансе, стабилност и све те ствари. Не узимају здраво за готово. Открили су да је опен соурце компетентан кроз своје процене и схватају да је, у најгорем случају, „Можда постоје та два случаја употребе која можда не могу да урадим, али већина мојих случајева употребе убрзања данас је изузетно могућа са отвореним кодом стацк. "И омогућавамо његово кориштење. Значи, то је тачно тачно место. Желели су опен соурце. Стварно желе да изађу из ситуације закључавања добављача у којој су навикли много, много година. Затим долазимо и кажемо: "Знате шта, учинићемо отворени код много, много лакшим и пријатељскијим за употребу за вас."

Дез Бланцхфиелд: Мислим да је други изазов који предузећа наилазе када доведу традиционалну владу, често генерација која стоји иза неких крвавих ивица узбудљивих ствари о којима овде причамо, а не мислим да као негативна незнатна. Само што је реалност они имају генерацију и пут који треба да прођу да би ослободили оно што сматрају стабилним платформама за пролазак, развој старих школа и циклусима интеграције УАТН-а, тестирања и документације, маркетинга и продаје. Док у типу који радите, мислим да је оно што ме занима требало да размотрим да гледајући нека од ваших последњих издања синоћ радећи некакав истраживачки рад, сада сте добили овај микс где сте добили компетенције из перспективног саветодавног становишта и примене, али сте такође добили хрпу у коју се можете пријавити. Мислим да ће се ту време борити неко време. Много њих смо видели као и ја на пијаци. Они су често у ономе што ја зовем сустизање чворова, док из онога што нам говорите кад водите те разговоре и проводите вани.

Можете ли нам дати пар примера неких граничних вертикала које сте видели усвајање? На пример, заиста постоји нишно окружење као што је ракетна наука и постављање сателита у свемир и прикупљање података са Марса. На планети то ради само неколицина људи. Али постоје велике вертикале попут здравља, на пример, у ваздухопловству, бродарству, логистици, производњи и инжењерингу, који су пар примера већих и широких сектора индустрије које сте до сада видели да сте видели заиста добро усвајање у?

Ананд Венугопал: Телцо је сјајан пример.

Само ћу брзо поправити своје слајдове овде. Да ли можете видети слајд овде, студија случаја 4?

Ово је случај великог телцо-а који гута податке с топ-бок уређаја и ради с њима више ствари. Они гледају шта купци стварно раде у реалном времену. Они гледају где се грешке догађају у стварном времену у сет-топ боковима. Они покушавају да обавесте позивни центар о томе, ако овај купац одмах позове, информације о вези са кодом са сет-топ бок-а овог купца, информације о картама за одржавање брзо корелирају да ли овај сет-топ бок купца има проблем или не и раније купац изговара реч. Свака кабловска компанија, сваки већи телцо покушава да то уради. Они гутају податке са сет-топ бок рачунара, раде аналитику у стварном времену, раде анализу кампања како би могли да постављају своје огласе. Постоји огроман случај употребе.

Као што рекох, постоји хипотекарна компанија која је опет генерички образац у коме се велики системи укључују у обраду података. Подаци који иду кроз систем А у систем Б у систем Ц и то су регулисани послови којих све треба бити доследно. Често се системи међусобно искључују, један систем каже: „Обрађујем стотину кредита укупне вредности 10 милиона долара.“ Систем каже: „Не, обрађујем 110 зајмова неких других различит број. "То морају брзо да разреше, јер у ствари обрађују исте податке и праве различите интерпретације.

Било да се ради о кредитној картици, обради зајма, пословном процесу или је то хипотекарни пословни поступак или нешто треће, помажемо им да у стварном времену раде на корелацији и усклађивању како би се осигурало да ти пословни процеси остану у току. То је још један занимљив случај употребе. Постоји главни амерички уговарач који гледа на ДНС саобраћај ради откривања аномалија. Изграђен је модел за обуку ван мреже и они раде оцјењивање на основу тог модела промета у реалном времену. Неки од тих занимљивих случајева употребе. Постоји главна авиокомпанија која гледа у сигурносне редове и покушава вам дати ту информацију да: „Хеј, то је ваша капија вашег авиона за ваш лет. Ред чекања ТСА данас траје око 45 минута у односу на два сата у односу на нешто друго. “То ажурирање добијате унапред. Још раде на томе. Занимљив случај употребе ИоТ-а, али одличан случај струјне аналитике према корисничком искуству.

Ребека Јозвиак: Ово је Ребецца. Док сте на тему случајева употребе, поставља се велико питање члана публике који се пита: „Да ли су ово студије случаја, да ли се ове иницијативе покрећу са аналитичке стране информационих система куће или се више воде од њих предузеће које има специфична питања или потребе на уму? "

Ананд Венугопал: Мислим да видимо око 60 процената или отприлике, 50 до 55 процената, углавном врло проактивних, ентузијастичних технолошких иницијатива које се знају, које су прилично паметне и разумију одређене пословне захтеве и вероватно имају једног спонзора који они идентификовани, али то су технолошки тимови који се спремају за напад случајева пословне употребе који долазе и онда када једном изграде способност, знају да могу то учинити и онда крену у посао и агресивно то продају. У 30 до 40 процената случајева видимо да пословање већ има посебан случај употребе који моли за способност аналитичке струје.

Ребека Јозвиак: То има смисла. Имам још једно мало техничко питање од члана публике. Пита се да ли ови системи подржавају и структуриране и неструктуриране токове података, попут седимената Твиттер токова или Фацебоок постова у стварном времену, или га треба првобитно филтрирати?

Ананд Венугопал: Производи и технологије о којима говоримо врло брзо подржавају и структуриране и неструктуриране податке. Могу да се конфигуришу. Сви подаци имају неку структуру, било да је ријеч о тексту или КСМЛ-у или уопће. Постоји нека структура у погледу постојања фееда временске ознаке. Можда постоји још једна мрља коју је потребно рашчланити да бисте могли да убризгате парсес у ток да бисте анализирали структуре података. Ако је структурирано, тада само кажемо систему: "У реду, ако постоје вредности одвојене зарезима, а прва је низ, друга је датум." Тако да можемо да убацимо ту анализу интелигенције у слојеве горњег екрана и лако обрађивати и структуриране и неструктуриране податке.

Ребека Јозвиак: Имам још једно питање публике. Знам да смо прошли мало иза врха сата. Овај полазник жели знати, чини се да можда апликације за стриминг у реалном времену развијају и потребу и прилику за интегрисање назад у трансакционе системе, на пример, системе за спречавање преваре које стварају. У том случају, да ли трансакциони системи морају бити прилагођени да се некако уклапају у то?

Ананд Венугопал: То је спајање, зар не? То је спајање система трансакција. Они понекад постају извор података где анализирамо трансакције у реалном времену и у многим случајевима где рецимо да постоји проток апликација и овде покушавам да покажем статички сајт за претраживање података, а затим у нашем случају где нека врста стриминга унутра и тражите статичку базу података као што је ХБасе или РДБМС како бисте обогатили проточне податке и статичке податке како бисте донели одлуку или аналитички увид.

Постоји још један велики индустријски тренд који такође видимо - конвергенција ОЛАП-а и ОЛТП-а - и зато имате базе података попут Куду и базе података у меморији које подржавају и трансакције и аналитичку обраду у исто време. Слој за обраду токова био би у потпуности у меморији и гледаћемо или повезати се с неким од ових трансакцијских база података.

Ребецца Јозвиак: Мешовита оптерећеност рада била је једна од последњих препрека за скок, мислим. Дез, Робин, да ли имате још два питања?

Дез Бланцхфиелд: Ускочит ћу у последње питање и закључити то ако вам не смета. Први изазов са којим су се организације са којима сам се бавила последњу деценију или на тај начин довео до овог узбудљивог изазова аналитике струјања, прво што имају тенденцију да ставе на стол када смо започели разговор око целог овог изазова је где добили смо сет вештина? Како да преквалификујемо сет вештина и како да интерно добијемо ту способност? Улазак и наговор Импетус-а нас држи кроз путовање, а затим имплементирање као први први корак и то има пуно смисла.

Али за средње до велике организације, које су ствари које тренутно видите да се припремите за то, да изградите ту способност интерно, да добијете било шта од само основног вокабулара око њега и какве поруке могу да ураде организација око преласка на овакав оквир и преуређивање постојећег техничког особља од ИТ-а од генералног директора, тако да они могу сами то да покрену кад га изградите и имплементирате? Врло кратко, какви су изазови и како их решавају, купци са којима се суочавате, врсте изазова које су пронашли и како пролазе кроз решавање тог преквалификације и повратити искуство и знање како би се припремили за то и били Да ли сте у могућности да се крећете около?

Ананд Венугопал: Често је мали скуп људи који покушавају изаћи и купити платформу за аналитичку струју већ разумно паметни јер су Хадооп свесни, већ су стекли своје вештине Хадооп МапРедуце и зато што блиско сарађују са Хадооп-ом дистрибутера, било да је позната. На пример, све добија Кафка. Они нешто раде с тим и Сторм или Спарк стреаминг су у њиховом опен-соурце домену. Дефинитивно су људи упознати са њом или граде вештине око ње. Али започиње са малим набором људи који су довољно квалификовани и довољно паметни. Они присуствују конференцијама. Уче и да продавцима постављају интелигентна питања, а у неким случајевима уче и са добављачима. Пошто продавци долазе и представљају се на првом састанку, они можда не знају ствари, али их поново читају и тада почињу да се играју са њим.

Та мала група људи је језгро и тада она почиње да расте и сви сада схватају да се први случај пословне употребе операционализује. Ту почиње талас и видели смо на самиту Спарк прошле недеље где је велико предузеће попут Цапитал Онеа било напољу и у пуној снази. Бирали су Спарка. Говорили су о томе. У Спарку образују много својих људи јер томе доприносе и у многим случајевима као корисници. То видимо и са многим, многим великим предузећима. Све започиње с неколико малих група врло паметних људи, а затим започиње талас свеукупног образовања и људи знају да се једном виши потпредседник или једном виши директор поравнају и желе да се кладите на ту ствар и реч се свашта и сви почну да покупе ове вештине.

Дез Бланцхфиелд: Сигуран сам да и ви фантастично проводите време за изградњу тих шампиона.

Ананд Венугопал: Да. Пуно се едукујемо док радимо са почетним шампионима и држимо течајеве тренинга и много, многи за наше велике купце смо се вратили и имали таласе и таласе тренинга како бисмо увели пуно корисника у фазу коришћења, посебно на Хадооп МапРедуце сајту. Открили смо да смо у великој компанији за кредитне картице која је наш клијент испоручили барем можда пет до осам различитих програма обуке. Такође имамо бесплатна издања у заједници за све ове производе, укључујући наш, кутије за песак које људи могу да преузму, навикну и да се тако и образују.

Дез Бланцхфиелд: То је све што имам јутрос за тебе. Много вам хвала. Невјероватно ми је занимљиво видјети врсте модела и случајеве употребе које данас имате за нас. Хвала вам.

Ананд Венугопал: Одлично. Хвала вам пуно људи.

Ребецца Јозвиак: Хвала свима што сте нам се придружили у овим мрежним емисијама Хот Тецхнологиес. Било је фасцинантно чути од Дез Бланцхфиелд-а, др Робина Блоор-а и из Импетус Тецхнологиес-а, Ананда Венугопала. Хвала вам, излагачи Хвала говорницима и хвала публици. Следећег месеца имамо још једну Хот Тецхнологиес, ​​па потражите то. Увек можете пронаћи наш архив архивиран на Инсидеаналисис.цом. Такође смо ставили пуно садржаја на СлидеСхаре и неколико занимљивих битова на ИоуТубе-у.

То је све народе. Хвала још једном и добар дан. Ћао.

Коришћење ватрених људи: добијање пословне вредности од струјне аналитике: транскрипт вебинара