Кућа Базе података Изградња пословне архитектуре података

Изградња пословне архитектуре података

Anonim

Аутор особља Тецхопедиа, 28. септембра 2016

Извлачење: Домаћин Ребецца Јозвиак разговара о рјешењима за архитектуру података с Ерицом Литтлеом из ОСТХУС-а, Малцолмом Цхисхолмом из Првих Сан Францисцо партнера и Роном Хуизенгом из ИДЕРА-е.

Тренутно нисте пријављени. Пријавите се или пријавите да бисте видели видео.

Ребецца Јозвиак: Даме и господо, здраво и добродошли у Хот Тецхнологиес 2016. Данас разговарамо о „Изради архитектуре података заснованих на пословању“, дефинитивно врућа тема. Моје име је Ребецца Јозвиак, бит ћу вам домаћин за данашњи вебцаст. Ми твеетујемо с хасхтагом од # ХотТецх16, па ако сте већ на Твиттеру, слободно се придружите и томе. Ако у било којем тренутку имате питања, пошаљите их у окно за питања у доњем десном углу екрана и ми ћемо се побринути да на њих одговоре. Ако не, побринут ћемо се да их наши гости добију за вас.

Тако данас имамо заиста фасцинантну поставу. Много тешких удараца данас је с нама. Имамо Ериц Литтле-а, потпредседника науке о подацима о компанији ОСТХУС. Имамо Малцолма Цхисхолма, главног официра за иновације, што је заиста цоол наслов, за Фирст Сан Францисцо Партнерс. А ми имамо Рон Хуизенга, старијег менаџера производа из ИДЕРА-е. И, знате, ИДЕРА има заиста пун пакет решења за управљање подацима и моделирање. И данас ће нам дати демонстрацију о томе како његово решење делује. Али пре него што стигнемо до тога, Ериц Литтле, пренећу ти лопту.

Ериц Литтле: У реду, хвала пуно. Дакле, овде ћу проћи неколико тема за које мислим да ће се мало односити на Рон-ове разговоре и надам се да ће такође поставити позорницу за неке од ових тема, неке К&А.

Дакле, оно што ме је занимало шта ИДЕРА ради је да мислим да они исправно истичу да данас сложена окружења заиста покрећу бројне пословне вредности. А под комплексним окружењима мислимо на сложена окружења података. А технологија се заиста брзо креће и тешко је бити у току у данашњем пословном окружењу. Тако ће они људи који раде у технолошким просторима често видети да имате купце који раде са проблемима: „Како да користим велике податке? Како да уградим семантику? Како да повежем неке од ових нових ствари са својим старијим подацима? "И тако даље, и таква врста нас данас води у ова четири велика податка која су многи добро познати, и знам да може бити више од четири понекад - видео сам чак осам или девет - али обично, када људи причају о стварима попут великих података или ако говорите о великим подацима, обично гледате у нечему што је на нивоу предузећа. И тако ће људи рећи, у реду, добро, размислите о количини ваших података, што је и обично фокус - то је управо ваш износ. Брзина података односи се на то колико брзо могу да их померам или колико брзо могу да их питам или добијем одговоре, и тако даље. И лично мислим да је лева страна тога нешто што се релативно брзо решава и савладава много различитих приступа. Али на десној страни видим пуно могућности за унапређење и пуно нових технологија које заиста долазе у први план. А то стварно има везе са трећом колоном, разноврсношћу података.

Другим речима, данас већина компанија гледа на структуриране, полуструктуриране и неструктуриране податке. Подаци о слици почињу да постају врућа тема, тако да можете користити рачунарски вид, гледати пикселе, моћи да изгребате текст, НЛП, вађење ентитета, имате графичке податке који излазе или из статистичких модела или излазе из семантичких модела, имате релацијске податке који постоје у табелама и тако даље. Тако да спајање свих тих података и свих ових различитих врста заиста представља велики изазов и то ћете видети у, знате, код Гартнера и других људи који на неки начин прате трендове у индустрији.

И онда је последња ствар о којој људи причају у великим подацима често овај појам гласности, што је заиста неизвесност ваших података, нејасноћа тих података. Колико добро знате о чему се ради у вашим подацима, колико добро разумете шта је ту и знате? Могућност употребе статистика и могућност коришћења неке врсте информација око онога што можда знате или коришћење одређеног контекста могу вам бити од користи. Дакле, способност да гледате податке на овај начин у смислу колико их имате, колико брзо требате да их померате или добијате, све врсте података које имате у вашем предузећу и колико сте сигурни где то је, какав је, какав је квалитет, и тако даље. Ово заиста захтева велики, координирани напор сада између мноштва појединаца за ефикасно управљање њиховим подацима. Стога је моделирање података све важније у данашњем свету. Тако добри модели података заиста постижу велики успех у пословним апликацијама.

Имате изворе података из различитих извора, као што смо рекли, што заиста захтева много различитих врста интеграције. Тако да је све то здруживање заиста корисно да бисте могли покренути упите, на пример, кроз бројне врсте извора података и повући информације назад. Али да бисте то учинили, потребне су вам добре стратегије мапирања и мапирање таквих података и праћење тих мапирања могу бити прави изазов. И онда имате ово питање, па како могу повезати своје наслеђене податке са свим тим новим изворима података? Претпоставимо да имам граф, да ли узимам све своје релацијске податке и ставим их у граф? Обично то није добра идеја. Па како је могуће да људи управљају свим оваквим моделима података који се дешавају? Анализа се заиста мора обавити на многим од тих различитих извора података и комбинација. Дакле, одговори који из тога произилазе, одговори који су људима потребни да би донијели добре пословне одлуке су критични.

Дакле, не ради се само о изградњи технологије ради технологије, заправо је, шта ћу радити, шта могу учинити с њом, какву анализу могу да радим и способности, као што сам већ имао Причало се о томе да сакупимо ове ствари, да их интегрирамо, заиста је јако важно. А једна од ових врста анализа затим се покреће на стварима попут федералне претраге и упита. То заиста постаје неопходно. Ваши упити морају нормално бити нанизани у више врста извора и повући информације на поуздан начин.

Један кључни елемент који често, посебно људи ће гледати кључне ствари као што су семантичке технологије - и то је нешто за што се надам да ће Рон мало разговарати у ИДЕРА приступу - како раздвојити или управљати моделни слој ваших података из самог слоја података, из тих необрађених података? Дакле, доле на нивоу података можда имате базе података, можда податке о документу, можда податке о прорачунским таблицама, можда слике слике. Ако сте у областима попут фармацеутске индустрије, имате огромне количине научних података. А онда изнад тога људи обично траже начин да направе модел који им омогућава да брзо интегришу те податке и заиста када тражите податке, не желите да све податке увуку у свој слој модела, оно што тражите у моделном слоју је да вам пружи лепу логичку представу о томе шта су ствари, заједничке речнике, уобичајене врсте ентитета и односа и могућност да стварно доспете до података тамо где се налазе. Значи мора да каже шта је то, и мора да каже где је, и мора да каже како да то донесем и вратим.

Дакле, ово је био приступ који је био прилично успешан у потицању семантичких технологија напред, што је област у којој много радим. Дакле, питање које сам желео да поставим Рону и за које мислим да ће бити корисно у одељку Питања и одговора је да видим како се то постиже ИДЕРА платформом? Је ли слој модела заправо одвојен од податковног слоја? Да ли су они интегрисанији? Како то функционише и који су од резултата и користи које виде из њиховог приступа? Стога референтни подаци постају такође критични. Дакле, ако ћете имати овакве моделе података, ако ћете моћи да се удружите и претражите ствари, заиста морате имати добре референтне податке. Али проблем је што се референтни подаци могу заиста тешко одржати. Стога је често именовање стандарда само по себи тежак изазов. Једна група ће назвати нешто Кс, а једна група назвати нешто И, а сада имате проблем како неко нађе Кс и И када тражи ову врсту информација? Због тога што не желите да им дате само део података, већ им желите дати све што је повезано. У исто време се мењају услови, софтвер постаје застарио и тако даље, како задржати и одржавати те референтне податке током времена?

И опет, семантичке технологије, конкретно користећи ствари попут таксономија и речника, речника података, пружиле су стандардни начин да се то уради, који је заиста врло робустан, користи одређене врсте стандарда, али заједница база података је то учинила за такође дуго, само на различите начине. Мислим да је један од кључева овдје размишљање о томе како користити можда моделе односа ентитета, како користити можда моделе графова или неку врсту приступа овдје који ће вам, надамо се, пружити стандардни распоређени начин руковања с вашим референтним подацима. И онда, наравно када једном имате референтне податке, стратегије мапирања морају управљати широким распоном имена и ентитета. Тако стручњаци за теме често воле да користе сопствене изразе.

Дакле, изазов је увек у томе, како некоме дати информације, али учинити их релевантним за начин на који они разговарају о томе? Дакле, једна група може имати један начин гледања на нешто, на пример, ви сте хемичар који ради на неком леку, можда сте структурални биолог који ради на истом леку, а можда имате различита имена за исте врсте ентитета које се односе на ваше поље. Морате смислити начине да ове персонализоване терминологије обједините, јер је други приступ, што морате присилити људе да напусте свој термин и користе туђе, што често не воле. Још једна поанта овде је тешко руковање великим бројем синонима, тако да у подацима многих људи постоји пуно различитих речи које се могу односити на исту ствар. Тамо имате проблем са референцама користећи мноштво односа један на један. Специјализовани појмови разликују се од индустрије до индустрије, тако да ако ћете смислити свеобухватно решење за ову врсту управљања подацима, колико је лако преносив из једног пројекта или једне апликације у другу? То може бити још један изазов.

Аутоматизација је важна, а уједно је и изазов. Ручно је руковати референтним подацима скупо. Скупо је држати ручно мапирање и скупо је имати стручњаке за теме који престају обављати свакодневне послове и морају стално улазити и стално поправљати речнике података и поново ажурирати дефиниције и тако даље, и тако даље. Репликабилни вокабулари заиста показују велику вредност. То су често речници које можете пронаћи изван организације. Ако радите, на пример, са сировом нафтом, постојаће одређене врсте речника које можете позајмљивати из простора отвореног кода, исто што и са лековима, исто са банкарском индустријом и финансијским, исто као и са многим оваквим областима. Људи постављају вокабуле за поновну употребу, генеричке, поновљиве, да би их људи могли користити.

И опет, гледајући ИДЕРА алат, занима ме како се они баве овим путем у погледу коришћења врста стандарда. У свету семантике често видите ствари попут СКОС модела који пружају стандарде барем шире од / уже од односа, а то може бити тешко направити у ЕР моделима, али, знате, није немогуће, само зависи од тога колико машина и оно повезивање са којима можете да се бавите у тим врстама система.

И на крају, само сам хтео да упоредим неке семантичке моторе које видим у индустрији и замолим Рона и да га мало примери да би могао да разговара о томе како се ИДЕРА-ин систем користи у комбинацији са било којом семантичком технологијом. Да ли је способан да се интегрише у троструке продавнице, базе података графова? Колико је лако користити спољне изворе јер се такве ствари у семантичком свету често могу позајмљивати помоћу СПАРКЛ крајњих тачака? Можете увести РДФ или ОВЛ моделе директно у свој модел - обратите се на њих - тако, на пример, онтологија гена или протеинска онтологија, која може живети негде у сопственом простору, са својом управљачком структуром и ја могу једноставно увести све или део тога колико ми треба у сопственим моделима. Занима ме како ИДЕРА приступа овом питању. Да ли морате све одржавати интерно или постоје начини да користите друге врсте стандардизованих модела и увучете их унутра и како то функционира? И последња ствар коју сам овде споменуо је колико је ручни рад заиста укључен у изградњу појмовника и складишта метаподатака?

Тако да знам да ће нам Рон показати неке демонстрације о тим стварима које ће бити заиста занимљиве. Али проблеми које често видим у консултацијама са купцима су у томе што се пуно грешака догоди ако људи пишу у сопственим дефиницијама или сопственим метаподацима. Дакле, ви погрешно пишете, добијате грешке у дебелим прстима, то је једна ствар. Такође добијате људе који вам могу узети нешто, знате, само Википедију или извор који није нужно оног квалитета који можда желите у вашој дефиницији, или је ваша дефиниција само из перспективе једне особе, тако да није потпуна и није тада јасно. како функционише процес управљања Управљање је, наравно, веома велико питање када год говорите о референтним подацима и било када када говорите о томе како се то може уклопити у нечије главне податке, како ће користити њихове метаподате и ускоро.

Само сам желео да неке од ових тема изнесем тамо. Ово су предмети које видим у пословном простору кроз мноштво различитих врста консултантских ангажмана и пуно различитих простора, а стварно ме занима шта ће нам Рон показати са ИДЕРА-ом да истакне неке од ових тема . Хвала вам пуно.

Ребецца Јозвиак: Хвала вам пуно, Ериц, и стварно ми се свиђа ваш коментар да се могу појавити многе грешке ако људи пишу своје дефиниције или метаподате. Знам да у свету новинарства постоји мантра да „многе очи праве мало грешака“, али када се дође до практичних примена, превише руку у теглици са колачићима обично оставља вас са много поломљених колачића, зар не?

Ериц Литтле: Да, и микробе.

Ребека Јозвиак: Да. С тим да идем даље и проследићу га Малцолму Цхисхолму. Малцолм, под је твој.

Малцолм Цхисхолм: Хвала вам пуно, Ребецца. Желео бих мало да се осврнем на оно о чему је Ериц говорио и да им додам, на неки начин, неколико запажања на која, знате, Рон можда хоће да одговори и у разговору о „Товард Бусинесс-Дривен Дата Арцхитецтуре ”- шта значи водити посао и зашто је то важно? Или је то само неки облик прељуба? Мислим да није.

Ако погледамо шта се догађа од када знате, рачунари главних система заиста су постали доступни компанијама - рецимо, око 1964. године - до данас, можемо видети да је било пуно промена. А ове промене бих могао да резимирам као померање са процесно-центричне на концентрисану на податке. То је оно што пословне архитектуре података чини тако важним и толико релевантним за данашњи дан. И мислим да, знате, то није само буззворд, већ нешто апсолутно стварно.

Али можемо то мало више ценити ако заронимо у историју, тако да се враћамо у прошлост, све до 1960-их и неко време након тога доминирали су маинфрамес. Они су тада уступили место рачунарима на којима сте се заправо побунили према корисницима када су се ПЦ-и појавили. Побуна против централизованог ИТ-а за коју су мислили да не испуњава њихове потребе није била довољно агилна. То је брзо довело до дистрибуираног рачунања, када су рачунари повезани. А онда се почео догађати интернет, који је замагљивао границе предузећа - сада је могао комуницирати са странкама изван себе у смислу размјене података, што се раније није догађало. И сада смо прешли у еру облака и великих података где је облак платформа која заиста комодитизира инфраструктуру, па одлазимо, као да је то, ИТ да треба водити велике центре података, јер, знате, ми имамо капацитет облака који нам је доступан и који је у складу са оним великим подацима о којима је Ериц, ето, елоквентно разговарао. И у целини, како видимо, како је дошло до промене технологије, она постаје више усмерена на податке, више нам је стало до података. Као и на Интернету, како се размењују подаци. Уз велике податке, четири или више в-а самих података.

У исто време, и што је још важније, случајеви пословне употребе су се померали. Када су рачунари први пут представљени, коришћени су за аутоматизацију ствари попут књига и записа. И све што је био ручни процес, који је укључивао књиге или такве ствари, било је програмирано у кући. То се у 80-има пребацило на доступност оперативних пакета. Више вам није требало да пишете сопствене платне листе, могли сте да купите нешто што је то и учинило. То је резултирало великим падом у то време или реструктуирањем многих ИТ одељења. Али тада се појавила пословна интелигенција, са стварима попут складишта података, углавном у 90-има. Следили су дотцом пословни модели који су, наравно, били велика бесна. Затим МДМ. Са МДМ почињете да видите да не размишљамо о аутоматизацији; ми се заправо заправо фокусирамо на прикупљање података као података. А затим аналитика, која представља вредност коју можете добити из података. А унутар аналитике видите компаније које су врло успешне чији се основни пословни модел врти око података. Гоогле, Твиттер, Фацебоок били би део тога, али можете тврдити и да је Валмарт.

И тако посао сада стварно размишља о подацима. Како можемо извући вредност из података? Како подаци могу покренути посао, стратегију, а ми смо у златном добу података. С обзиром на то, шта се дешава у погледу наше архитектуре података, ако се подаци више не сматрају само испухом који долази из позадине, већ је у средишту наших пословних модела? Па, део проблема који имамо у постизању тога је ИТ стварно заглавио у прошлости са животним циклусом развоја система који је био последица брзог суочавања са том фазом аутоматизације процеса у раном добу ИТ-а и рада у пројекти су слична ствар. За ИТ - и ово је помало карикатура - али оно што покушавам рећи је да су неке препреке за добијање пословне архитектуре података засноване на пословању зато што смо, некако, некритички прихватили културу у ИТ-у која потиче из минулог доба.

Дакле, све је пројекат. Реците ми ваше захтеве детаљно. Ако ствари не функционишу, то је зато што ми нисте рекли своје захтеве. Па, то данас не функционише са подацима, јер не почињемо са аутоматизованим ручним процесима или, знате, техничком претворбом пословних процеса, врло често почињемо са већ постојећим подацима о производњи које покушавамо. да бисте добили вредност. Али нико ко спонзорише пројекат усмерен на податке заиста не разуме те податке дубински. Морамо да откријемо податке, морамо да урадимо анализу изворних података. А то се заправо не подудара са развојем система, знате - водопад, СДЛЦ животним циклусом - од којих бих, Агиле, тврдио да је нека боља верзија тога.

А оно на што се фокусира технологија и функционалност, а не подаци. На пример, када радимо тестирање у фази тестирања, обично функционише, функционише ли моја функционалност, рецимо мој ЕТЛ, али ми не тестирамо податке. Не тестирамо наше претпоставке о улазним подацима који долазе. Да смо то урадили, били бисмо у можда бољој форми и као неко ко је радио пројекте складишта података и претрпео промене узводно, разбијајући моје ЕТЛ-ове, ценио бих то. У ствари, оно што желимо да видимо тестирање је прелиминарни корак непрекидног праћења квалитета података о производњи. Дакле, овде имамо пуно ставова где је тешко постићи архитектуру података засновану на пословању, јер смо условљени ером усредсређености на процесе. Морамо да пређемо на концентрисаност на податке. И ово није тотална транзиција, знате, још увек морамо пуно радити на процесу, али ми у стварном смислу не размишљамо када треба, и околности које се дешавају када заиста дужан да то уради.

Сада посао схвата вредност података, желе да их откључају, па како ћемо то урадити? Па како да направимо транзицију? Па, податке стављамо у средиште развојних процеса. И препуштамо послу да води информације. И разумијемо да нико не разумије постојеће изворне податке на почетку пројекта. Могли бисте тврдити да су структура података и сами подаци тамо стигли кроз ИТ и операције, тако да бисмо то требали знати, али стварно не. Ово је развој усмерен на податке. Дакле, морамо размишљати о томе где ћемо и како радити моделирање података у свету који се фокусира на податке, морамо имати петље за повратне информације за кориснике у смислу прецизирања њихових захтева за информацијама, као што смо и откривање података и профилисање података., предвидимо анализу података о изворима и како постепено добијамо све већу сигурност о нашим подацима. И сада говорим о традиционалнијем пројекту као што је МДМ чвориште или складиште података, а не нужно и пројекти великих података, мада је то, ипак, држим, прилично близу тога. И тако те повратне везе укључују моделе података, знате, постепено унапређују свој модел података и комуницирају с корисницима како би били сигурни да се захтеви за информацијама усавршавају на основу онога што је могуће, доступних изворних података, како их они боље разумеју, тако да то више није случај да се модел података налази, знате, у стању које или није тамо или је у потпуности изведено, то је постепено довођење у фокус тога.

Слично томе, више низводно од тога имамо осигурање квалитета где развијамо правила за тестирање квалитета података како бисмо били сигурни да су подаци унутар параметара о којима дајемо претпоставке. Улазећи у њега, Ериц је мислио на промене референтних података, које се могу догодити. Не желите бити жртва низводне врсте, некаквих, неуправљаних промјена у том подручју, тако да правила о осигурању квалитета могу прећи у постпродукцију, континуирано праћење квалитета података. Тако да можете почети да видите да ли ћемо бити усмерени на податке, како радимо развој усредсређен на податке сасвим је другачији од СДЛЦ и Агиле заснованог на функционалности. А онда морамо обратити пажњу и на пословне приказе. Имамо - и опет ово одјекује оно што је Ериц говорио - имамо модел података који дефинише нацрт приче о подацима за нашу базу података, али истовремено су нам потребни они концептуални модели, они пословни укази на податке који традиционално нису учињени у прошлост. Мислили смо да понекад мислимо да модел података може све, али морамо имати концептуални приказ, семантику и погледати податке, претворити их кроз слој апстракције који модел складиштења преводи у посао. поглед. И опет, све оно о чему је Ериц говорио у смислу семантике постаје важно за то, тако да у ствари имамо додатне задатке за моделирање. Мислим да је то, знате, занимљиво ако сте се упустили у редове као дата моделер, као што сам и ја, и опет, нешто ново.

И на крају, хтео бих да кажем да је и већа архитектура такође морала да одражава ову нову стварност. На пример, традиционални МДМ за купце је некако уреду, убацимо наше податке о клијентима у састајалиште где можемо, знате, имати смисла у смислу стварно само квалитета података за бацк оффице апликације. Што са гледишта пословне стратегије представља неку врсту зијевања. Данас, међутим, гледамо МДМ чворишта купаца која у себи садрже додатне податке о профилу купца, а не само статичке податке који тада заиста имају двосмерни интерфејс са апликацијама за трансакције купца. Да, и даље подржавају стражњу канцеларију, али сада знамо и за таква понашања наших купаца. Ово је скупље за изградњу. Ово је сложеније градити. Али пословање се води на начин на који традиционални МДМ купаца није. Ви тргујете оријентацијом на посао против једноставнијих дизајна који су лакши за имплементацију, али за посао, то желе видети. Заиста смо у новој ери и мислим да постоји низ нивоа на које морамо одговорити архитектури података о пословним покретама и мислим да је изузетно узбудљиво време за радити ствари.

Па хвала, враћам се теби Ребека.

Ребецца Јозвиак: Хвала Малцолм, и стварно сам уживао у ономе што сте рекли о моделима података мора да храни пословни поглед, јер, за разлику од онога што сте говорили, где је ИТ тако дуго држао узде и једноставно више није такав случај и да се култура мора променити. И прилично сам сигуран да је у позадини постојао пас који се с вама сложио 100%. И с тим ћу проследити лопту Рону. Заиста сам узбуђена што видим ваш демо. Рон, под је твој.

Рон Хуизенга: Хвала вам пуно и пре него што скочимо на то, ја ћу проћи кроз неколико слајдова, а затим мало демо-а јер, како су Ериц и Малцолм истакли, ово је веома широка и дубока тема, и с оним о чему данас говоримо само смо стругали површину јер постоји толико много аспеката и толико ствари које заиста требамо размотрити и погледати из архитектуре засноване на послу. Наш приступ је да се та модела заснивају на основу модела и добију истинску вредност из модела, јер их можете користити као комуникацијско возило као и слој за омогућавање других система. Без обзира да ли радите архитектуру оријентисану на услуге или друге ствари, модел заиста постаје основа живота онога што се догађа, са свим метаподацима око њега и подацима које имате у свом послу.

Оно о чему желим да говорим је готово корак овамо уназад, јер се Малцолм дотакао неке историје начина на који су се развијала решења и такве ствари. Један од начина да заиста укажем на то колико је важно имати здраву архитектуру података је случај коришћења у који сам се често сусретао приликом консултација пре него што сам ушао у улогу управљања производом, а то је било да бих улазио у организације да ли су радили на трансформацији пословања или су само замењивали неке постојеће системе и такве ствари, и врло брзо се показало колико лоше организације разумеју своје податке. Ако узмете одређени случај употребе, као што је овај, без обзира да ли сте саветник или можда је то особа која је тек започела организацију, или је ваша организација током година створена стицањем различитих компанија, шта завршите Изузетно је сложено окружење веома брзо, са много нових различитих технологија, као и наслеђена технологија, ЕРП решења и све остало.

Дакле, једна од ствари које ми стварно можемо да учинимо нашим приступом моделирању је да одговоримо на питање како да имам смисла за све ово? Ми стварно можемо почети да дијелимо информације заједно, тако да посао може искористити информације које имамо правилно. И испада, шта имамо тамо у тим срединама? Како могу да користим моделе да избацим информације које су ми потребне и да боље разумем те информације? И тада имамо традиционалне врсте метаподатака за све различите ствари као што су модели релацијских података и навикли смо да видимо ствари попут дефиниција и речника података, знате, типове података и ту врсту ствари. Али шта је са додатним метаподацима које желите да забиљежите да бисте им заиста дали још више значења? Као што су, који су ентитети заиста кандидати који би требали бити референтни објекти података, који би требали бити матични објекти за управљање подацима и те врсте ствари и повезати их заједно. И како информације тече кроз организацију? Подаци тече из начина на који се троше и са процесног угла, али и линије података у смислу путовања информација кроз наша предузећа и како се сналази кроз различите системе или кроз складишта података, тако да знамо када правимо И-решења или оне врсте ствари, заправо користимо тачне информације за задатак који нам је при руци.

А онда је врло важно како назовимо све те заинтересоване стране да сарађују, а посебно пословне актере, јер су они ти који нам дају право значење онога што ти подаци јесу. На крају дана компанија поседује податке. Они дају дефиниције за вокабулар и ствари о којима је Ериц говорио, па нам треба место да све то повежемо заједно. А начин на који то радимо је кроз наше моделирање података и архитектуре спремишта података.

Дотакћу се неколико ствари. Говорићу о ЕР / Студио Ентерприсе Теам Едитион. Првенствено ћу говорити о производу архитектуре података на којем радимо моделирање података и такву врсту ствари, али постоји пуно других компоненти пакета које ћу се само укратко дотакнути. Видећете један исечак пословног архитекта, где можемо да радимо концептуалне моделе, али можемо и моделе пословних процеса и да повежемо те моделе процеса да повежемо стварне податке које имамо у нашим моделима података. Заиста нам помаже да повежемо тај спој. Софтваре Арцхитецт омогућава нам да направимо додатне конструкције, попут неких УМЛ моделирања и оних врста ствари да бисмо дали потпорну логику неким другим системима и процесима о којима говоримо. Али што је веома важно док се крећемо према доле имамо сервер складишта и тим и о томе ћу говорити као о две половине исте ствари. Репозиториј је место где чувамо све моделиране метаподатке, као и све пословне метаподате у смислу пословних глосарија и израза. А будући да имамо ово окружење засновано на складишту, онда можемо све те различите ствари спојити заједно у том истом окружењу и тада то можемо учинити доступнима за конзумацију, не само техничким људима, већ и пословним људима. И тако стварно почињемо да возимо колаборацију.

И последњи део о коме ћу укратко говорити је да, када уђете у ова окружења, тамо нису само базе података. Имат ћете бројне базе података, складишта података, такође ћете имати пуно, како бих рекао, наслијеђених артефаката. Можда су људи користили Висио или друге дијаграме да би нацртали неке ствари. Можда су имали и друге алате за моделирање и такве ствари. Дакле, оно што можемо учинити с МетаВизардом је заправо извући неке од тих информација и унети их у наше моделе, учинити га актуелним и поново моћи да га користимо, конзумирамо, а не само да га седимо вани. Сада постаје активан део наших радних модела, што је врло важно.

Кад уђете у неку организацију, као што рекох, вани је много различитих система, пуно ЕРП решења, неусклађена одељења. Многе организације такође користе СааС решења која се такође екстерно контролишу и управљају, тако да ми не контролишемо базе података и те врсте ствари у домаћинима на њима, али још увек морамо да знамо како ти подаци изгледају и, наравно, метаподаци око тога. Оно што такође налазимо је пуно застарјелих заостављених система који нису очишћени због приступа заснованог на пројекту о којем је Малцолм говорио. Невероватно је како ће последњих година организације вршити пројекте, замењиваће систем или решење, али често нема довољно буџета пројекта да би се декомпонирала застарела решења, па су сада само у фази. И морамо схватити шта се заправо можемо ослободити у нашем окружењу, као и шта је корисно напријед. И то је повезано са лошом стратегијом разградње. То је део те исте ствари.

Оно што такође проналазимо, јер је много организација изграђено из свих ових различитих решења, је да видимо много интерфејса од тачке до тачке са мноштвом података који се крећу на многим местима. То требамо бити у стању да рационализујемо и схватимо ону линију података коју сам укратко напоменуо да бисмо могли имати кохезивнију стратегију као што је коришћење сервисно оријентисане архитектуре, корпоративних сервисних аутобуса и сличних врста ствари које би пружиле тачне информације на модел објављивања и претплате који исправно користимо у свом послу. А онда, наравно, још увек морамо да урадимо неку врсту аналитике, било да користимо складишта података, марку података са традиционалним ЕТЛ-ом или користимо неке од нових података. Све се своди на исту ствар. Све су то подаци, било да се ради о великим подацима, било да се ради о традиционалним подацима у релацијским базама података, све те податке морамо објединити како бисмо их могли управљати и знати чиме се бавимо у свим нашим моделима.

Опет, сложеност коју ћемо учинити је да имамо неколико корака које желимо да будемо у стању да урадимо. Прво, уђете унутра и можда немате оне нацрте о томе како изгледа тај информативни пејзаж. У алатки за моделирање података попут ЕР / Студио Дата Арцхитецт прво ћете радити много обрнутог инжењеринга у смислу да укажемо на изворе података који су вани, унесете их и затим заједно спојите у више репрезентативних модели који представљају целокупан посао. Важно је да ли желимо да можемо и да декомпонујемо те моделе дуж пословних линија како бисмо их могли повезати у мањим деловима, на које се могу односити и наши пословни људи, као и наши пословни аналитичари и други актери који раде бацам се на посао.

Стандарди за називе су изузетно важни и овде говорим о неколико различитих начина. Именовање стандарда у смислу како именујемо ствари у нашим моделима. То је прилично лако учинити у логичким моделима, где имамо добру конвенцију о именовању и добар речник података за наше моделе, али тада такође видимо различите конвенције о именовању за многе физичке моделе које доносимо. обрнути инжењер, прилично често видимо скраћена имена и ту врсту ствари о којој ћу говорити. А ми их морамо превести на значајна енглеска имена која имају смисла за посао да бисмо могли да схватимо шта су све ови подаци који имамо у окружењу. А затим, универзално пресликавање је начин на који их спајамо.

Поврх тога, ми бисмо затим документовали и дефинисали даље и ту можемо даље класификовати своје податке са нечим што се зове Прилози, а затим ћу вам показати неколико слајдова. А затим затварањем петље, желимо да применимо то пословно значење, које повезујемо у нашим пословним глосарима и можемо их повезати са различитим артефактима модела, тако да знамо када говоримо о одређеном пословном термину, где је то имплементирани у наше податке у целој организацији. И на крају, већ сам говорио о чињеници да нам све ово треба да буде спремиште засновано на пуно могућности сарадње и објављивања, тако да наши актери могу то да користе. Разговарат ћу о обрнутом инжењерингу прилично брзо. Већ сам вам некако врло брзо нагласио то. То ћу вам показати у стварном демо приказу само да вам покажем неке ствари које тамо можемо донети.

И желим да разговарам о неким различитим типовима модела и дијаграмима које бисмо произвели у овој врсти сценарија. Очигледно да ћемо концептуалне моделе урадити у многим случајевима; Нећу трошити пуно времена на то. Заиста желим да разговарам о логичним моделима, физичким моделима и специјализованим врстама модела које можемо да створимо. И важно је да све то можемо креирати на истој платформи за моделирање да бисмо их могли спојити заједно. То укључује димензионалне моделе и моделе који користе неке од нових извора података, као што је НоСКЛ који ћу вам показати. А онда, како изгледа модел линије података? А о томе како убацимо те податке у модел пословног процеса, о чему ћемо даље говорити.

Овде ћу прећи на окружење за моделирање само да бих вам пружио врло висок и брз преглед. И верујем да би сада требало да видите мој екран. Пре свега, желим да говорим о само традиционалном типу модела података. А начин на који желимо да организујемо моделе када их унесемо, желимо да их можемо декомпонирати. Дакле, оно што овде видите на левој страни је да у овој датотеци модела имамо логичке и физичке моделе. Следећа ствар је да ли можемо да је разделимо дуж пословне декомпозиције, па зато видите фасцикле. Светлоплаве су логични модели, а зелене физички модели. А ми такође можемо детаљно процесирати, тако да у оквиру ЕР / Студио, ако имате декомпозицију пословања, можете ићи на онолико нивоа колико дубоко или под-модела, а промене које направите на нижим нивоима аутоматски се одражавају на вишим нивоа. Тако врло брзо постаје веома моћно окружење за моделирање.

Нешто што желим да истакнем, што је веома важно да почнемо да прикупљамо ове информације је да можемо имати више физичких модела који одговарају и једном логичком моделу. Често имате логичан модел, али можда имате физичке моделе на различитим платформама и такву врсту ствари. Можда је једна инстанца СКЛ Сервер-а, можда је друга примера Орацле. Имамо могућност да све то повежемо заједно у истом моделинг окружењу. И ту опет имам стварни модел складишта података који, опет, може бити у истом окружењу за моделирање или га можемо имати у складишту и повезати га кроз различите ствари.

Оно што сам вам заиста желео да покажем су неке друге ствари и друге варијанте модела у које улазимо. Дакле, када уђемо у традиционални модел података као што је овај, навикли смо да видимо типичне ентитете са ступовима и метаподацима и таквом врстом ствари, али та гледишта варирају врло брзо када се почнемо бавити неким од ових новијих НоСКЛ технологија или, како их неки још увек воле називати, технологијама великих података.

Па рецимо сада да и ми имамо кошницу у нашем окружењу. Ако инжењер обрнемо из окружења кошнице - а можемо да напредујемо и обрнемо инжењера из Хиве-а овим потпуно истим алатом за моделирање - видећемо нешто што је мало другачије. Све податке и даље видимо као конструкте, али наши ТДЛ-ови су различити. Они од вас који су навикли да виде СКЛ, оно што бисте сада видели је Хиве КЛ, који је веома сличан СКЛ-у, али из истог алата сада можете да почнете да радите са различитим језицима скрипта. На тај начин можете да моделирате у овом окружењу, генеришете га у окружењу кошнице, али што је још важније, у сценарију који сам описао, можете да покренете инжењер и све то смислите и почнете да га правите заједно. .

Узмимо још једну која је мало другачија. МонгоДБ је још једна платформа коју изворно подржавамо. А кад почнете да улазите у ЈСОН типове окружења у којима имате складишта докумената, ЈСОН је друга животиња и у њој постоје конструкције које не одговарају релативним моделима. Убрзо почињете да се бавите појмовима као што су уграђени објекти и уграђени низови објеката када почнете испитивати ЈСОН, а ти концепти не постоје у традиционалној релацијској нотацији. Оно што смо овде урадили је да смо заправо проширили ознаку и наш каталог да бисмо то могли поднијети у истом окружењу.

Ако овде погледате лево, уместо да видите ствари попут ентитета и табела, ми их називамо објектима. И видите различите назнаке. Овде се још увек виде типични типови референтних нотација, али ови плави ентитети које приказујем на овом одређеном дијаграму су заправо уграђени објекти. И показујемо различите кардиналности. Кардиналност дијаманата значи да је то објект на једном крају, али кардиналност једног значи да у оквиру издавача ако следимо тај однос имамо уграђени објект адресе. Испитивањем ЈСОН-а открили смо да је потпуно иста структура објеката уграђена у заштитника, али заправо је уграђена у низ објеката. То видимо не само преко самих конектора, али ако погледате стварне ентитете, видећете да испод заштитника видите адресе које су такође класификоване као низ објеката. Добијате врло описно гледиште како то можете унијети.

И опет, сада оно што смо до сада видели у само неколико секунди су традиционални релациони модели који су на више нивоа, можемо учинити исту ствар са Хивеом, можемо исто то и са МонгоДБ и другим великим изворима података као добро. Оно што такође можемо да учинимо, и то ћу вам брзо показати, разговарао сам о чињеници довођења ствари из других различитих области. Претпостављам да ћу увести модел из базе података или га обрнути инжењер, али унећу га из спољних метаподатака. Само да вам пружим врло брзо гледање на све врсте ствари које можемо почети да уносимо.

Као што видите, имамо безброј ствари са којима можемо заправо унијети метаподате у наше моделирајуће окружење. Почевши од ствари попут Амазон Редсхифт-а, Цассандра, многих других платформи великих података, тако да видите доста њих на попису. Ово је по абецедном реду. Виђамо много великих извора података и такве ствари. Такође видимо мноштво традиционалних или старијих окружења за моделирање кроз које заправо можемо пренети те метаподате. Ако прођем овде - и нећу трошити време на свакога од њих - видећемо пуно различитих ствари које можемо донети од њих, у смислу моделирања платформи и платформи података. И нешто што је веома важно схватити овде је још један део који можемо да учинимо кад почнемо да причамо о линији података, у Ентерприсе Теам Едитион-у такође можемо испитивати ЕТЛ изворе, било да су то ствари попут Таленд или пресликавања СКЛ Сервер Информатион Сервицес, можемо ли У ствари, то је потребно да покренемо и наше дијаграме линијских података и нацртамо слику онога што се дешава у тим трансформацијама. Свеукупно имамо више од 130 ових различитих мостова који су заправо део Ентерприсе Теам Едитион производа, тако да нам заиста помаже да брзо извучемо све артефакте у једно окружење за моделирање.

На крају, али не најмање битно, желим такође да разговарам о чињеници да не можемо изгубити из вида чињеницу да су нам потребне друге врсте конструкција ако радимо складиштење података или било коју врсту аналитике. И даље желимо да имамо могућност да радимо ствари попут димензионалних модела где имамо табеле чињеница и имамо димензије и такве врсте ствари. Оно што желим да вам покажем и то је да такође можемо да имамо проширења наших метаподатака која нам помажу да категорисемо које су врсте димензија и све остало. Дакле, ако овде погледам картицу димензионалних података, на пример, на једну од њих, она ће заправо аутоматски препознати, на основу узорка модела који види, и дати почетну тачку да ли мисли да је то димензија или табела чињеница. Али осим тога, оно што можемо учинити је унутар димензија и те врсте ствари, чак имамо различите врсте димензија које можемо користити да класификујемо податке и у окружењу складиштења података. Толико моћне могућности да их заједно шивамо.

Ускочићу у овај јер сам тренутно у демо окружењу и показаћу вам још неколико ствари пре него што се вратим на тобогане. Једна од ствари коју смо недавно додали ЕР / Студио Дата Арцхитецт је да смо наишли на ситуације - и то је врло чест случај коришћења када радите на пројектима - програмери размишљају у погледу предмета, док наши подаци Модели склони размишљати у смислу табела и ентитета и те врсте ствари. Ово је врло поједностављен модел података, али он представља неколико основних концепата, где програмери или чак пословни аналитичари или пословни корисници могу да их сматрају различитим предметима или пословним концептима. Било је врло тешко класификовати их до сада, али оно што смо уствари урадили у издању ЕР / Студио Ентерприсе Теам Едитион, у издању за 2016. годину, је ли сада имамо концепт под називом Пословни подаци објекти. А оно што нам омогућава је да нам омогући да капсулирамо групе ентитета или табеле у праве пословне објекте.

На пример, оно што имамо овде у овом новом приказу је заглавље наруџбенице и линија налога су сада склопљени, они су капсулирани као предмет, о њима бисмо мислили као о јединици рада када упоримо податке, и ми их окупљамо, тако да је сада врло лако повезати то са различитом публиком. Поновно се могу користити у окружењу за моделирање. Они су прави објекат, а не само конструкција цртежа, али такође имамо додатну корист што, када заправо комуницирамо из перспективе моделирања, можемо их селективно урушити или проширити тако да можемо створити сажет приказ дијалога са одређеном интересном публиком, а ми такође можемо, наравно, задржати детаљнији приказ као да видимо овде више техничке публике. То нам заиста даје стварно добро средство комуникације. Оно што сада видимо је комбиновање више различитих типова модела, допуњавајући их концептом пословних података, а сада ћу говорити о томе како ми заправо примењујемо мало више значења на ове врсте ствари и како их спајамо заједно у наше укупна окружења.

Само покушавам да нађем свој ВебЕк овде, тако да сам у могућности да то учиним. И ту се враћамо натраг до Хот Тецх слајдова. Само ћу пребацити неколико слајдова овде јер сте их већ видели на самој демонстрацији модела. Желим да причам о именовању стандарда врло брзо. Желимо применити и применити различите стандарде именовања. Оно што желимо је да имамо могућност да заправо похранимо предлошке стандарда за именовање у наша складишта како бисмо у основи изградили то значење, кроз речи или фразе или чак скраћенице, и везали их за смислену енглеску врсту речи. Користићемо пословне термине, скраћенице за сваку, а можемо одредити редослед, случајеве и додати префиксе и суфиксе. Типични случај употребе за то је обично када људи граде логички модел, а затим заправо креирају напред да би створили физички модел где би могли да користе скраћенице и све остало.

Лепа ствар је што је подједнако моћна, чак и моћнија обрнуто, ако само можемо рећи који је од тих стандарда именовања био на неким физичким базама података које смо направили обрнуто, можемо узети те скраћенице, претворити их у дуже речи и вратите их уназад у енглеске изразе. Ми заправо сада можемо извући одговарајућа имена како изгледају наши подаци. Као што кажем, типични случај употребе је да се крећемо напред, логички у физички и мапирамо складишта података и ту врсту ствари. Ако погледате снимак екрана са десне стране, видећете да постоје скраћена имена од извора извора и када смо примењивали образац стандарда за именовање, у ствари имамо више пуних имена. А ми можемо ставити размаке и све остало ако желимо, у зависности од предлошка стандарда именовања који смо користили. Можемо учинити да изгледа, али желимо да изгледа као да је укључен у наше моделе. Тек када знамо како се нешто зове, можемо заправо почети да му придајемо дефиниције, јер ако не знамо шта је то, како на њега можемо применити неко значење?

Лепа ствар је, да ли се заправо можемо позвати на то када радимо све врсте ствари. Говорио сам о обрнутом инжењерингу, заправо можемо истовремено позивати шаблоне именовања стандарда када радимо обрнути инжењеринг. Дакле, у једном низу корака кроз чаробњака, оно што смо у стању да урадимо је да ако знамо шта су то конвенције, можемо да вратимо инжењеринг физичкој бази података, вратит ћемо је као физичке моделе у окружење за моделирање и то је такође ће применити те конвенције о именовању. Тако ћемо видети каква су имена на енглеском језику у одговарајућем логичком моделу у окружењу. Можемо то и да комбинујемо са генерацијом КСМЛ схеме како бисмо могли да узмемо модел, па чак и да га потиснемо са нашим скраћеницама, било да радимо СОА оквире или ту врсту ствари, тако да можемо такође избацити различите конвенције о именовању коју заправо имамо у самом моделу. Даје нам пуно веома моћних могућности.

Опет, ево примера како би изгледао да имам шаблону. Овај заправо показује да сам у Конвенцији о стандардима о именовању имао ЕМП за „запосленог“, САЛ за „плату“, ПЛН за „план“. Могу их применити и да их интерактивно покрећу док израђујем моделе и стављам ствари. Да сам користио ову скраћеницу и уписао „План плаће запослених“ на име ентитета, поступио би са шаблоном стандарда именовања. Овдје сам дефинирао, дао би ми ЕМП_САЛ_ПЛН док сам стварао ентитете и одмах ми дао одговарајућа физичка имена.

Опет, врло добро за пројектирање и развој инжењеринга. Имамо врло јединствен концепт и ту стварно почињемо да спајамо та окружења. А зове се Универзално мапирање. Након што смо све ове моделе увели у наше окружење, што смо у стању да урадимо, претпостављајући да смо сада применили ове конвенције о именовању и лако их је пронаћи, сада можемо да користимо конструкцију која се у ЕР зове Универсал Маппингс / Студио. Можемо повезати ентитете преко различитих модела. Где год да видимо „купца“ - вероватно ћемо имати „купца“ у пуно различитих система и пуно различитих база података - све то можемо почети повезивати тако да, кад радим с њим у једном моделу, можете видети где су манифестације купаца у осталим моделима. Будући да имамо слој модела који то представља, можемо га чак и повезати са изворима података и свести га на наше, где се користе упите у које базе података такође живе. То нам заиста даје могућност да све то повежемо врло кохезивно.

Показао сам вам пословне пословне податке. Такође желим да говорим о проширењима метаподатака, која називамо Прилози, врло брзо. Оно што то чини јесте даје нам могућност стварања додатних метаподатака за наше моделе модела. Често бих постављао ове врсте својстава како би извукао много различитих ствари из перспективе управљања подацима и квалитетом података, а такође да би нам помогао у управљању подацима и правилима чувања података. Основна идеја је да направите ове класификације и можете их повезати где год желите, на нивоу табеле, ступца, те врсте ствари. Наравно, најчешћи случај употребе је да су ентитети табеле, и тада могу да дефинишем: који су моји матични подаци, шта су моје референтне табеле, које су моје трансакционе табеле? Из перспективе квалитета података могу да радим класификације у смислу важности за посао тако да можемо дати приоритет напорима на чишћењу података и таквој врсти ствари.

Оно што се често занемарује јесте, каква је политика задржавања различитих врста података у нашој организацији? Можемо их поставити и заиста их можемо повезати са различитим врстама артефаката информација у нашем окружењу за моделирање и, наравно, такође у нашем складишту. Лепота је у томе што ови прилози живе у нашем речнику података, тако да када користимо речнике података предузећа у околини, можемо их повезати на више модела. Морамо их дефинисати само једном и можемо их користити изнова и изнова преко различитих модела у нашем окружењу. Ово је само брзи снимак екрана који показује да заправо можете да одредите када радите прилог, који су то комади на које желите да га приложите. А овај пример овде је заправо списак вредности, тако да када они уђу можете да изаберете са листе вредности, имате велику контролу у окружењу за моделирање онога што се бира, и чак можете да поставите шта је подразумевано вредност је ако вредност није одабрана. Тако пуно снаге. Живе у речнику података.

Нешто што бих хтео да вам покажем мало доле на овом екрану, а осим тога видите прилоге који се приказују у горњем делу, испод њега видите информације о безбедности података. Ми заправо можемо применити политике безбедности података и на различите податке у окружењу. За различита мапирања усклађености, класификације безбедности података, један број њих испоручујемо из оквира које можете само да генеришете и почнете да користите, али можете дефинисати и своје мапирање и стандарде сагласности. Било да радите ХИПАА или неку од других иницијатива вани. И заиста можете да започнете изградњу овог врло богатог метаподатака у вашем окружењу.

А онда Рјечник и појмови - овдје се повезује пословно значење. Често имамо рјечнике с подацима које врло често организација користи као полазну точку за почетак истјеривања глосариа, али терминологија и глагол су често врло технички. Дакле, оно што можемо учинити је да, ако желимо, користимо их као полазну тачку за истјеривање глосарских записа, али ми заиста желимо да их посједују. Оно што смо урадили у окружењу тимског сервера је да смо људима дали могућност да креирају пословне дефиниције, а затим их можемо повезати са различитим артефактима модела који им одговарају и у окружењу за моделирање. Такође препознајемо оно о чему се раније расправљало, што више људи куцате, то је већи потенцијал за људску грешку. Оно што такође радимо у нашој глосарској структури је: једно, ми подржавамо хијерархију појмовника, тако да у организацији можемо имати различите типове појма или различите врсте ствари, али што је још важније јесте да ли већ имате неке од ових извора вани, уз изразе и све што је дефинисано, ми заправо можемо да урадимо увоз ЦСВ-а да их увучемо у наше окружење за моделирање и наш тимски послужитељ или наш глосар, а затим да почнемо да се повезујемо одатле. И сваки пут када се нешто промени постоји потпуни траг ревизије о томе шта је било са сликама пре и после, у смислу дефиниција и свега осталог, а оно што ћете видети у блиској будућности такође је већи радни процес ауторизације. тако да заиста можемо контролисати ко је задужен за то, одобрења од стране одбора или појединаца, и такве ствари, како би процес управљања постао још робуснији како напредујемо.

Ово такође чини за нас када имамо ове појмове у глосару нашег послужитеља за тим, ово је пример уређивања ентитета у самом моделу који сам овде изнео. Можда имају повезане изразе, али оно што такође радимо је да постоје речи које се налазе у том појму који се појављују у белешкама или описима онога што овде имамо у нашим ентитетима, оне се аутоматски приказују светлијом хипервезаном бојом и ако прелазећи мишем преко њих, заправо можемо видети и дефиницију из пословног речника. Чак нам пружа и богатије информације када конзумирамо саме информације, са свим појмовима глосара који су вани. Заиста помаже да се обогатите у искуству и примените значење на све са чим радимо.

Па, опет, то је био врло брз лет. Очигледно смо да бисмо могли провести дане на овоме док смо укопавали различите делове, али ово је врло брзо летење по површини. Оно чему стварно тежимо је да схватимо како изгледају та сложена податковна окружења. Желимо побољшати видљивост свих тих артефаката података и сарађивати их како бисмо их избацили са ЕР / Студио. Желимо омогућити ефикасније и аутоматизованије моделирање података. И то су све врсте података о којима говоримо, било да се ради о великим подацима, традиционалним релацијским подацима, складиштима докумената или нечем другом. И опет смо то постигли јер имамо моћне инжењерске могућности за напред и назад за различите платформе и друге алате које можда имате тамо. И све је у дељењу и комуникацији у целој организацији са свим заинтересованим странама. Ту применимо значење кроз називе стандарда. Затим примењујемо дефиниције кроз наше пословне речнике. Тада можемо урадити додатне класификације за све наше могућности управљања помоћу проширења метаподатака, попут проширења квалитета података, класификација за управљање матичним подацима или било које друге врсте класификација које желите да примените на те податке. А онда можемо додатно сумирати и још више побољшати комуникацију са објектима пословних података, са различитом заинтересованом публиком, посебно између моделара и програмера.

И опет, оно што је веома важно у томе је, иза свега се налази интегрисано складиште с врло робусним могућностима управљања променама. Данас нисам имао времена да га покажем јер постаје прилично сложен, али складиште има веома робусне управљачке промене и могућности ревизије. Можете да радите са именованим издањима, можете да радите са именованим верзијама, а ми такође имамо могућност и за оне од вас који раде на управљању променама, можемо то право повезати са вашим задацима. Данас имамо могућност постављања задатака и повезивања промена вашег модела са задацима, баш као што би програмери своје промене кода повезали са задацима или корисничким причама са којима раде.

Поново, то је био врло брз преглед. Надам се да је довољно да се потакне ваш апетит како бисмо могли да водимо много дубље разговоре о раздвајању неких од тих тема како идемо у будућности. Хвала вам на вашем времену и враћам се вама, Ребецца.

Ребека Јозвиак: Хвала, Роне, то је било фантастично и имам доста питања публике, али желим да пружим шансу нашим аналитичарима да потону зубима у оно што сте морали да кажете. Ериц, идем даље и можда ако желиш да се позабавиш овим слајдом или другим, зашто не би прво кренуо напријед? Или било које друго питање.

Ериц Литтле: Наравно. Извини, шта је било питање, Ребецца? Желиш да питам нешто конкретно или …?

Ребека Јозвиак: Знам да сте у почетку имали нека питања за Рона. Ако желите да сада тражите да се обраћа било коме од њих или неком од њих са слајда или било чему другом што је изазвало ваше интересовање за које желите да питате? О функцијама ИДЕРА-иног моделирања.

Ериц Литтле: Да, једна од ствари, Рон, па како ви момци, изгледа да су дијаграми које сте показивали генералне врсте дијаграма односа ентитета као што бисте их обично користили у изградњи базе података, зар не?

Рон Хуизенга: Да, генерално говорећи, али наравно да имамо проширене врсте складишта докумената и такве врсте ствари. Заправо смо варирали од чисто чисте релацијске нотације, уствари смо додали и нове ознаке за остале трговине.

Ериц Литтле: Да ли постоји начин да момци употребљавате моделе засноване на графовима, па постоји ли начин да се интегрише, на пример, претпоставимо да имам нешто налик врхунском квадранту, ТопБраид композитор алату или сам учинио нешто у Протеге-у или, као што знате, финансијски момци у ФИБО-у, раде пуно семантике, РДФ ствари - да ли постоји начин да се у ову алатку уведе та врста моделирања типа графа односа између ентитета и искористи то?

Рон Хуизенга: Ми заправо гледамо како можемо да управљамо графовима. Данас не бавимо се експлицитним базама података графова и таквом врстом ствари, али тражимо начине на које то можемо учинити да бисмо проширили наше метаподате. Мислим, можемо ствари унијети преко КСМЛ-а и такве врсте ствари, ако барем можемо направити неку врсту КСМЛ предаје да бисмо је довели као почетну тачку. Али гледамо елегантније начине да то унесемо.

Такође сам вам показао и списак обрнутих инжењерских мостова који такође имамо тамо, тако да увек гледамо на проширења тих мостова и за одређене платформе. Ако је то има смисла, непрестано се улажу напори да се пригрли мноштво ових нових конструкција и различитих платформи вани. Али могу рећи да смо дефинитивно на челу тога. Ствари које сам приказао, на пример, на МонгоДБ-у и таквој врсти ствари, ми смо први добављач који се бави моделирањем података и то стварно урадимо у сопственом производу.

Ериц Литтле: Добро, да. Дакле, друго питање које сам вам тада поставио било је у погледу управљања и одржавања - као кад сте користили пример, када сте показали пример особе која је „запослени“, верујем да је била „ плату “и онда имате„ план “, постоји ли начин, како управљате, на пример, различитим врстама људи које можда имају - претпоставимо да имате велику архитектуру, зар не, претпоставимо да имате велико предузеће и људи почињу да склапају ствари у овом алату и овде имате једну групу која има реч "запослени" и једну групу која има реч "радник". И једна особа овде каже "плата", а друга особа каже "Плата."

Како момци помирите и управљате њима и управљате њима? Јер знам како бисмо то урадили у свету графова, користили бисте синонимне листе или рекли бисте да постоји један концепт и да има неколико атрибута, или у СКОС моделу можете рећи да имам преферирану етикету и имам бројне алтернативне налепнице које могу да користим. Како то радите?

Рон Хуизенга: Ми то радимо на неколико различитих начина, а пре свега, прво да разговарамо о терминологији. Једна од ствари које ми, наравно, радимо јесте да желимо да имамо дефинисане или санкционисане услове, а у пословном глосару је очигледно место где их желимо. И дозвољавамо линкове на синониме у пословном речнику, тако да оно што можете учинити је да кажете, ево мог термина, али можете дефинисати и шта су сви синоними за то.

Интересантна ствар је, наравно, кад почнете да гледате овај огроман пејзаж података са свим тим различитим системима који сте добили тамо, не можете једноставно изаћи тамо и променити одговарајуће табеле и оне врсте ствари у одговарају том стандарду именовања, јер то може бити пакет који сте купили, тако да немате контролу над променом базе података или било шта уопште.

Оно што бисмо тамо могли учинити, поред тога што можемо повезати дефиниције појмовника, јесте кроз универзална пресликавања о којима сам говорио, шта бисмо радили и какав је препоручени приступ, да имамо свеобухватни логички модел који одређује шта ти различити концепти пословања су о којима говорите. Повежите појмове пословног појма у оне ствари, и лепо је што сте добили овај конструкт који представља логичан ентитет какав јесте, а затим можете почети да се повезујете из тог логичког ентитета са свим имплементацијама тог логичког ентитета у различити системи.

Затим, тамо где то требате, можете видети, ох, „особа“ овде се у овом систему назива „запослени“. Овде се у овом другом систему "плата" назива "плата". Зато што ћете то видети, видећете све различите манифестације оних зато што сте их повезали.

Ериц Литтле: У реду супер, да, схватио сам. У том смислу, да ли је сигурно рећи да је то попут неких објектно оријентисаних приступа?

Рон Хуизенга: Донекле. Мало је интензивније од тога, претпостављам да би могли рећи. Мислим, могли бисте приступити ручном повезивању и проласку кроз њих и прегледати их и све њих. Једна ствар о којој заиста нисам имао прилике да разговарам - јер опет имамо пуно могућности - такође имамо и потпуно сучеље за аутоматизацију у самом алату Дата Арцхитецт. И макро способност, која је заиста програмски језик у алату. Дакле, ми заправо можемо радити ствари попут писања макронаредби, пустити их да их испитамо и испитати и створити везе за вас. Користимо га за увоз и извоз информација, можемо га користити за промену ствари или додавање атрибута, догађаја заснованих на самом моделу, или га можемо користити за покретање у серијама како бисмо заправо излазили и испитивали ствари, а заправо поселили различите конструкције у модел. Дакле, постоји потпуно интерфејс за аутоматизацију који људи такође могу да искористе. А употреба универзалних мапирања са њима био би врло моћан начин да се то постигне.

Ребецца Јозвиак: У реду, хвала Рон и хвала Ерицу. То су била сјајна питања. Знам да трчимо мало иза врха сата, али хтео бих да пружим Малцолму прилику да баци нека питања Роновом путу. Малцолм?

Малцолм Цхисхолм: Хвала, Ребецца. Дакле, Рон, веома је занимљиво, видим да овде има пуно могућности. Једна од области која ме веома занима је рецимо да ли имамо развојни пројекат, како видите моделера података користећи ове могућности и радите можда више у сарадњи са пословним аналитичарима, са процесором података, са аналитичаром квалитета података, и са пословним спонзорима који ће на крају бити одговорни за стварне захтеве за информацијама у пројекту. Како дизајнер података стварно, знате, чини пројекат ефикаснијим и ефикаснијим са могућностима које посматрамо?

Рон Хуизенга: Мислим да је једна од првих ствари коју треба да урадите тамо као модератор података - и не мислим да одаберете неке од моделара, али свеједно ћу - неки људи још увек имају утисак да модератор података је заиста такав тип улоге, дефинирамо како то функционише, ми смо чувари који осигуравају да је све исправно.

Сада постоји аспект тога, да морате бити сигурни да дефинишете звучну архитектуру података и све остало. Али још важнија ствар је као моделар података - и то сам очигледно открио док сам се саветовао - да ли треба да постанете модератор, тако да морате људе да повежете заједно.

То више неће бити дизајн, генерисати, градити базе података - оно што требате да будете у стању је да будете у могућности да радите са свим тим различитим интересним групама, радећи ствари попут обрнутог инжењеринга, увоза информација у други људи сарађују, било да се ради о појмовницима или документацији, све слично томе - и будите модератор који ће то увући у складиште и повезати концепте у спремишту и радити са тим људима.

Заправо је то много више врста окружења за колаборацију где чак и кроз дефинисање задатака или чак нити за расправу или ону врсту ствари коју имамо у тимском послужитељу људи заправо могу сарађивати, постављати питања и стићи до крајњих крајњих производа које они потреба за њиховом архитектуром података и њиховом организацијом. Да ли је такав одговор?

Малцолм Цхисхолм: Да, слажем се. Знате, мислим да је вештина олакшавања нешто што је веома пожељно код моделара података. Слажем се да то не видимо увек, али мислим да је то потребно и предлажем да понекад постоји склоност да останете у свом кутку радећи своје моделирање података, али заиста морате бити вани радећи са другим групама заинтересованих страна. или једноставно не разумете податковно окружење којим се бавите и мислим да модел пати као резултат тога. Али то је само моје мишљење.

Ron Huizenga: And it's interesting because you mentioned something earlier in your slide about the history about how businesses are kind of turned away from IT because they weren't delivering the solutions in a timely fashion and those types of things.

It's very interesting that in my later consulting engagements, prior to becoming a product manager, most of the projects that I did in the last two years before that, were business sponsored, where it was really the business that was driving it and the data architects and modelers were not a part of IT. We were a part of a business-sponsored group and we were there as facilitators working with the rest of the project teams.

Malcolm Chisholm: So I think that's a very interesting point. I think we're starting to see a shift in the business world where the business is asking, or thinking maybe, not so much as what do I do, being process like, but they're also starting to think about what is the data that I work with, what are my data needs, what is the data I'm dealing with as data, and to what extent can we get IDERA products and capabilities to support that viewpoint, and I think that the needs of the business, even though it's kind of still a little bit nascent.

Ron Huizenga: I agree with you and I think we're seeing it go more and more that way. We've seen an awakening and you touched on it earlier in terms of the importance of data. We saw the importance of data early in IT or in the evolution of databases, then as you say, we kind of got into this whole process management cycle – and process is extremely important, don't get me wrong there – but now what's happened is when that happened, data kind of lost focus.

And now organizations are realizing that data really is the focal point. Data represents everything that we're doing in our business so we need to make sure that we have accurate data, that we can find the correct information that we need to make our decisions. Because not everything comes from a defined process. Some of the information is a byproduct of other things and we still need to be able to find it, know what it means, and be able to translate the data that we see there ultimately into knowledge that we can use to drive our businesses better.

Malcolm Chisholm: Right, and now another area I've been struggling with is what I would call the data life cycle which is, you know, if we look at the sort of data supply chain going through an enterprise, we'd start with data acquisition or data capture, which might be the data entry but it might equally be, I'm getting data from outside the enterprise from some data vendor.

А онда из заузимања података прелазимо на одржавање података где размишљам о стандардизацији тих података и испоручивању на места где су потребни. А затим употребом података, стварним тачкама где су подаци, добићете вредност из података.

И у стара времена ово се све ради у једном индивидуалном стилу, али данас би то могло бити, знате, аналитичко окружење, на пример, а потом и даље од тога, архива, продавница, у коју стављамо податке када више нисмо треба и коначно поступак чишћења. Како видите да се моделирање података уклапа у управљање читавим животним циклусом података?

Рон Хуизенга: То је веома добро питање и једно о чему данас уопште нисам имао времена да се удубљујем у детаље, а то је оно о чему заправо почињемо да причамо је родословље података. Дакле, оно што ми у ствари можемо да урадимо јесте да у нашим алатима имамо могућност генерирања података и, као што сам рекао, ми можемо неке ствари извући из ЕТЛ алата, али можете их и пресликати само цртањем линије. Било који од ових модела података или базе података које смо снимили и увели у моделе, могли бисмо референцирати конструкте из тога у нашем дијаграму линија података.

Оно што можемо да урадимо је да нацртамо проток података, као што кажете, од извора до циља, а кроз читав животни циклус како ти подаци пролазе кроз различите системе и шта ћете пронаћи је да узмемо запослене 'подаци - то је један од мојих омиљених на основу пројекта који сам радио пре година. Радио сам са организацијом која је имала податке о запосленима у 30 различитих система. Оно што смо на крају радили - а Ребека је искочила слајд линија података - ово је овде прилично поједностављен слајд података, али оно што смо могли да учинимо је да унесемо све структуре података, наведемо их у дијаграму, а онда смо да ли заправо можемо почети да сагледамо шта су токови између и како су ти различити ентитети података повезани у току? А можемо и преко тога. Ово је део дијаграма тока података или линијског дијаграма који овде видимо. Ако желите даље од тога, ми такође имамо пословног архитекта део овог апартмана и иста ствар се односи и на њега.

Било која структура података коју смо снимили у окружењу за моделирање података може се референцирати у алату за пословно моделирање тако да чак и у дијаграмима вашег пословног модела или дијаграму пословног процеса можете упутити на појединачне залихе података ако желите да изађете из окружење за моделирање података, и док их користите у мапама вашег модела пословног процеса, можете чак и да одредите ЦРУД на њима како се те информације троше или производе, а затим можемо почети да генеришемо ствари попут извештаја о утицају и анализе и дијаграма из тога.

Оно чему тежимо и већ имамо пуно могућности, али једна од ствари коју имамо као врста стрелице коју гледамо док настављамо да развијамо алате како напредујемо, је у стању пресликати ту крајњу организациону линију података и читав животни циклус података.

Малцолм Цхисхолм: У реду. Ребека, да ли сам дозволио још једног?

Ребека Јозвиак: Дозволићу вам још један, Малцолме, само напред.

Малцолм Цхисхолм: Пуно хвала. Размишљајући о управљању подацима и размишљајући о моделирању података, како натерати те две групе да заједно раде ефикасно и разумију се?

Ериц Литтле: Па то је занимљиво, мислим да заиста зависи од организације, и то се враћа на мој ранији концепт, у оним организацијама у којима су иницијативе водиле пословање били смо везани тачно. На пример, водио сам архитектуру података тим, али били смо повезани управо са пословним корисницима и заправо смо им помагали да установе свој програм управљања подацима. Опет, више консултативног приступа, али заиста више од пословне функције.

Оно што заиста требате да будете у могућности да то урадите јесте да вам требају моделирачи података и архитекти који заиста разумију пословање, могу да се повезују са пословним корисницима и тада су им помогли да подигну процесе управљања око себе. Посао жели то да уради, али генерално гледано, ми имамо технолошко знање како бисмо им помогли да се истакну те врсте програма. То заиста мора бити сарадња, али треба бити у власништву предузећа.

Малцолм Цхисхолм: У реду, то је сјајно. Хвала вам.

Др Ериц Литтле: У реду.

Ребека Јозвиак: У реду, хвала пуно. Чланови публике, бојим се да нисмо стигли до ваших питања, али потрудићу се да их проследе одговарајућем госту који смо данас имали на линији. Желим вам пуно захвалити Ерику, Малцолму и Рону што су нам данас били гости. Ово су биле сјајне ствари, народе. А ако сте уживали у данашњем ИДЕРА вебцасту, ИДЕРА ће такође бити на Хот Тецхнологиес следећој среди ако се желите придружити, разговарајући о изазовима индексирања и Орацлес-а, тако да је још једна фасцинантна тема.

Пуно вам хвала, народе, пазите, и видимо се следећи пут. Ћао.

Изградња пословне архитектуре података