Деректерді тазалаушы - Data janitor

A деректер тазалаушы алу үшін жұмыс істейтін адам үлкен деректер және оны пайдалы көлемде жинақтау. Сондай-ақ, «деректерді таластырушы» деген атпен белгілі, ақпарат тазалаушы компаниялардағы деректерді електен өткізеді ақпараттық технологиясы өнеркәсіп. Көптеген адамдар бастаушы кәсіпкерлер деректердің үлкен көлеміне сүйеніңіз, сондықтан деректерді тазалаушы осы бизнеске деректерді түсіндірудің қарапайым, бірақ қиын процесінде көмектесу үшін жұмыс істейді.

Әдетте, ақпарат тазалаушының жұмысы толығымен автоматтандырылған деген сенім болса да, көптеген ғалымдар негізінен мәліметтер тазалаушылар ретінде жұмыс істейді. Ақпараттық технологиялар индустриясы жаңа мәліметтер көздеріне қарай бет бұра бастады тұтынушылар, сондықтан мәліметтер тазалаушылар соңғы жылдары жиі кездеседі.[1]

Деректер сыпырушылар көбінесе төрт кезеңнен тұратын процесте жұмыс істейді: қатынастарды таңдау және анықтау, шығару және ұйымдастыру, жүктеу және түсіндіру.[2] Деректер сыпырушылар қандай деректер сәйкес келетінін таңдамас бұрын деректер көздерін анықтайды және компанияның жобаларына пайдалы болатын мәліметтер арасындағы байланысты табады. Әрі қарай, олар ақпаратты шығарып, оны бизнес үшін қауіпсіз жерде сақтауға болатын форматқа салу үшін деректерді құрылымдайды. Ақырында, ақпарат тазалаушылар басқа қызметкерлермен бірге жұмыс жасайды көрнекі құралдар менеджерлер мен басшыларға олардан шығатын қорытындылардан нәтиже шығатын ұсыну. Осылайша, деректерді тазалаушылардың жұмысы жұмыс істеу үшін көптеген мәліметтерге сүйенетін бизнестің жұмысына ажырамас болып табылады.

Әдебиеттер тізімі

  1. ^ Лор, Стив. «Үлкен деректер ғалымдары үшін» дворниктің жұмысы «түсінікке басты кедергі болып табылады». The New York Times. New York Times компаниясы. Алынған 26 шілде 2015.
  2. ^ «Үлкен мәліметтерде мәліметтер дайындау - бұл жұмыстың көп бөлігі». Data Science Central. Sullexis LLC. Алынған 26 шілде 2015.