Кућа Аудио Зашто је хадооп савршена комбинација за секвенцирање генома

Зашто је хадооп савршена комбинација за секвенцирање генома

Преглед садржаја:

Anonim

Клиничка геномика је фасцинантна тема, где људи раде на врхунским технологијама да би се обрадили брзи и тачни резултати. На тржишту је доступно мноштво секвенцијских генома, који производе петабајте података о секвенци, а раст секвенцирања ће у блиској будућности створити егзабајте података. Овде је Хадооп савршена платформа за обраду сложеног рада из геномике. Хадооп може да складишти и сортира огромне количине информација и такође може да направи смислену анализу. (Да бисте схватили колико података заиста укључује, прочитајте Разумевање битова, бајтова и њихових вишеструких.)

Садашњост и будућност геномике

Данас је мапирање генома достигло врхунац. Многи људи повезани са геномичком индустријом пуне су радозналост, а како се представљају нове могућности, боља технологија је потреба сата. Секвенцирање генома је врло понављајући задатак који захтијева много ресурса. Само у 2013. години произведено је око 15 петабајта података, а само 2.000 секвенера. Овај износ који испада из чељусти укључује 300 КБ секвенционираних података о људском геному. Овом брзином производње података може се проценити да ће до 2018. године бити произведено отприлике једно претјерано бајт података. То ће бити последица раста секвенци, који ће производити све више и више података по вожњи. Други разлог је појава изузетно моћних и јефтиних машина за секвенцирање генома. Од 2008. цена ових машина непрестано опада. То је због моћних машина нове генерације које су се пласирале на тржиште.

Потребе индустрије за мапирање генома

Комплексни алгоритми се користе за обраду података који су прикупљени из људског генома. Затим, ове информације треба да се сачувају. Он ће се можда прегледати у будућности ради поређења са оригиналним подацима. Задатак обраде и складиштења 100 ГБ података није превише тежак, поготово када то радите са моћним машинама које раде у центрима за секвенцирање. Студије показују да се та количина података може обрадити у само око 1.000 ЦПУ сати, па је то врло лако. Таквом брзином техничког напретка, очигледно је да ће индустрија генома ускоро обрадити хиљаде гигабајта за само неколико секунди.

Зашто је хадооп савршена комбинација за секвенцирање генома