П:
Како нове могућности машинског учења могу омогућити ископавање докумената о залихама ради финансијских података?
А:Једна од узбудљивих нових граница машинског учења и АИ је та што су научници и инжињери кренули на различите начине да користе потпуно нове врсте ресурса за предвиђање кретања акција и исхода улагања. Ово је сјајан фактор мењања игара у финансијском свету и револуционише инвестиционе стратегије на врло дубок начин.
Једна од основних идеја за проширивање ове врсте основног истраживања је рачунска лингвистика, која укључује моделирање природног језика. Стручњаци истражују како користити текстуалне документе, од подношења СЕЦ-а до писама акционара до других периферних извора заснованих на тексту, у циљу повећања или прецизног прилагођавања анализа залиха или ради развоја потпуно нових анализа.
Бесплатно преузимање: Машинско учење и зашто је то важно |
Важно одрицање одговорности је да је све ово изводљиво само потпуно новим напретком неуронских мрежа, машинским учењем и анализом природног језика. Пре појаве МЛ / АИ, рачунарске технологије су углавном користиле линеарно програмирање за "читање" улаза. Текстуални документи су били претерано неструктурирани да би били корисни. Али, с напретком постигнутим у анализи природног језика у последњих неколико година, научници откривају да је могуће „минерати“ природни језик за мерљиве резултате или другим речима, резултате који се могу израчунати на неки начин.
Неки од најбољих доказа и најкориснијих примера тога су из различитих дисертација и докторског рада доступних на Интернету. У раду, „Примене машинског учења и рачунске лингвистике у финансијској економији“, објављеног у априлу 2016. године, Лили Гао је с разлогом објаснила релевантне процесе специфичне за рударјење поднесака корпоративних СЕЦ-ова, позива акционара и друштвених медија.
"Извлачење смислених сигнала из неструктурираних и великих димензија текстуалних података није лак задатак", пише Гао. "Међутим, развојем машинског учења и рачунских лингвистичких техника може се извршити обрада и статистичка анализа текстуалних докумената, а многе апликације статистичке анализе текста у друштвеним наукама показале су се успешним." Из Гаове расправе о моделирању и калибрацији у сажетку, цео развијени документ показује како неке од ових врста анализе раде у детаље.
Остали извори за активне пројекте укључују странице попут овог кратког ГитХуб пројекта, а овај ИЕЕЕ ресурс говори управо о добијању вредних финансијских информација из „анализе расположења на Твиттеру“.
Суштина је да употреба ових нових НЛП модела потиче брзу иновацију у кориштењу свих врста текстуалних докумената, не само за финансијску анализу, већ и за друге врсте најсавременијих открића, замагливши ту традиционално успостављену линију између „језика“ и "подаци."