Преглед садржаја:
- Дефиниција - Шта значи Откривање знања у базама података (КДД)?
- Техопедија објашњава откриће знања у базама података (КДД)
Дефиниција - Шта значи Откривање знања у базама података (КДД)?
Откривање знања у базама података (КДД) процес је откривања корисног знања из колекције података. Ова широко кориштена техника вађења података процес је који укључује припрему и одабир података, чишћење података, укључивање претходног знања о скуповима података и интерпретацију тачних рјешења из посматраних резултата.
Главна подручја примене КДД укључују маркетинг, откривање преваре, телекомуникације и производњу.
Техопедија објашњава откриће знања у базама података (КДД)
Традиционално, вађење података и откривање знања изводили су се ручно. Како је вријеме пролазило, количина података у многим системима нарасла је на већу од величине терабајта и више није могла да се одржава ручно. Штавише, за успешно постојање било ког предузећа откривање основних образаца података сматра се неопходним. Као резултат тога, развијено је неколико софтверских алата за откривање скривених података и претпоставки које су чиниле део вештачке интелигенције.
Процес КДД је достигао свој врхунац у последњих 10 година. Сада се налази много различитих приступа откривању, који укључују индуктивно учење, бајесову статистику, оптимизацију семантичких упита, стицање знања за стручне системе и теорију информација. Крајњи циљ је извлачење знања високог нивоа из података на ниском нивоу.
КДД укључује мултидисциплинарне активности. Ово обухвата складиштење и приступ подацима, алгоритме скалирања на огромне скупове података и интерпретацију резултата. Прочишћавање и приступ подацима који су укључени у складиштење података олакшавају КДД процес. Вештачка интелигенција такође подржава КДД откривањем емпиријских закона експериментирања и опажања. Обрасци препознати у подацима морају бити валидни на новим подацима и морају имати одређену сигурност. Ови обрасци се сматрају новим знањем. Кораци који су укључени у читав КДД процес су:
- Препознајте циљ КДД процеса из перспективе купца.
- Схватите укључене домене апликација и знање које је потребно
- Изаберите циљни скуп података или подскуп узорака података на којима се врши откривање.
- Очистите и прерадите податке одлучивањем о стратегијама за руковање недостајућим пољима и мењајте податке према захтевима.
- Поједноставите скупове података уклањањем нежељених варијабли. Затим анализирајте корисне функције које се могу користити за представљање података, у зависности од циља или задатка.
- Ускладите циљеве КДД-а са методама вађења података да бисте предложили скривене обрасце.
- Изаберите алгоритме уноса података да бисте открили скривене обрасце. Овај процес укључује одлучивање који модели и параметри могу бити прикладни за целокупни КДД процес.
- Тражите обрасце од интереса у одређеном репрезентативном облику, који укључују класификациона правила или дрвеће, регресију и групирање.
- Интерпретирати основна знања из минираних образаца.
- Искористите знање и укључите га у други систем за даље деловање.
- Документирајте га и направите извјештаје заинтересованим.
