ബിഗ് ഡാറ്റ വിശകലനവും വിവര സുരക്ഷയും

Anil Kumar K.V. [1988 IC]

അറിവ് മനുഷ്യസമൂഹത്തോടൊപ്പം തന്നെ വളർന്നു് വികസിച്ചതാണു്. അദ്ധ്വാനത്തിന്റെ സൃഷ്ടിയായ അറിവു് തന്നെ അദ്ധ്വാനം ലഘൂകരിക്കുന്നതിന്റേയും അദ്ധ്വാനശേഷി (അദ്ധ്വാനത്തിന്റെ സൃഷ്ടിപരമായ കഴിവു്) വര്‍ദ്ധിപ്പിക്കുന്നതിന്റേയും ഉപാധിയുമാണു്.

സമ്പത്തു് സൃഷ്ടിക്കാനുപകരിക്കുന്ന അറിവും അദ്ധ്വാനശേഷിയും മനുഷ്യസമൂഹത്തോടൊപ്പം തന്നെ വളർന്നു് വികസിച്ചു. അത്തരത്തിൽ നേടിയെടുത്ത സമ്പത്തിനു് ആനുപാതികമായാണു് സാമൂഹ്യ പുരോഗതി ഉണ്ടാകുന്നത്.  സമാഹരണം അഥവാ പഠിക്കൽ,  പ്രയോഗിക്കൽ അഥവാ ഉപയോഗിക്കൽ, മെച്ചപ്പെടുത്തൽ അഥവാ കൂട്ടിച്ചേർക്കൽ, തിരിച്ചു നൽകൽ അഥവാ പങ്കുവെക്കൽ എന്നീ നാലുഘട്ടങ്ങൾ അടങ്ങുന്ന ഒരു ചാക്രിക പ്രക്രിയയിലൂടെയാണ് അറിവ് വികസിക്കുന്നത്. ഏതൊരു അറിവിനേയും പൂർണ്ണമായും ഉൾക്കൊള്ളാൻ ഏതാനും വ്യക്തികൾക്കൊ, സ്ഥാപനങ്ങൾക്കൊ സാദ്ധ്യമല്ലെന്ന വസ്തുത, അതിന്റെ സാമൂഹ്യ ഉടമസ്ഥതയെയാണു് കാണിക്കുന്നതു്. അതേ സമയം തന്നെ അറിവിന്റെ വിതരണം എളുപ്പത്തിൽ സാദ്ധ്യമാകുന്നതിനാൽ, അവ സാമൂഹ്യ ഉടമസ്ഥതയിലിരിക്കുമ്പോഴും, ഏതൊരു വ്യക്തിക്കും, സ്ഥാപനത്തിനും സ്വതന്ത്രമായി ഉപയോഗിക്കാവുന്നതാണു്.

ഒരിക്കല്‍ രൂപപ്പെട്ട് ക്രോഡികരിക്കപ്പെട്ട് കഴിയുമ്പോള്‍ അറിവ്, ആപേക്ഷികമായി, സ്വതന്ത്രമായ അസ്തിത്വം കൈവരിക്കുന്നു. അറിവില്‍ നിന്ന്, അതുപയോഗിച്ചുള്ള മാനസികാദ്ധ്വാനത്തില്‍ നിന്ന്, ചിന്തയില്‍ നിന്നു തന്നെ പുതിയ അറിവ് സൃഷ്ടിക്കാന്‍ കഴിയുന്നു. പുതിയ ആശയങ്ങള്‍, പുതിയ തത്വങ്ങള്‍ രൂപപ്പെടുത്താന്‍ കഴിയുന്നു. ഇതു് മൂലം അദ്ധ്വാനമല്ല, അറിവ് മാത്രമാണു് സൃഷ്ടിയുടെ ഉപാധിയെന്ന തോന്നല്‍ പോലും ഉളവാക്കപ്പെടുന്നു. പക്ഷെ, അദ്ധ്വാനത്തോടു് (പ്രയോഗത്തോടു്) ബന്ധപ്പെടുത്താത്ത അറിവുകള്‍ അപ്രസക്തമാണു്. അവയ്ക് മൂല്യമില്ല.  ചുരുക്കത്തില്‍, അറിവ് അദ്ധ്വാനശേഷിക്കു് വഴങ്ങുന്നതും അതില്‍ നിന്നു് വേറിട്ട് സാമൂഹ്യ പ്രസക്തിയില്ലാത്തതുമാണു്. അതിനാല്‍, അദ്ധ്വാനശേഷിക്കു് സ്വതന്ത്രമായി അറിവുപയോഗിക്കാന്‍ കഴിയുന്ന വ്യവസ്ഥയാണു് സാമൂഹ്യ പുരോഗതിക്കാവശ്യം. അദ്ധ്വാന ശേഷിയുടെയും അറിവിന്റെയും മേലെ ചെലുത്തപ്പെടുന്ന എല്ലാത്തരം നിയന്ത്രണങ്ങളും സാമൂഹ്യ പുരോഗതി തടയുന്നതാണു്.

നേരിട്ട് പ്രയോഗസജ്ജമല്ലാത്ത, അസംസ്കൃതമായ അറിവിനെയാണ് പൊതുവെ വിവരം എന്ന പദംകൊണ്ട് സൂചിപ്പിക്കുന്നത്. പ്രായോഗിമായ അറിവ് സൃഷ്ടിക്കാൻ വിവരത്തെ സംസ്കരിച്ചെടുക്കണം. വിവര ശേഖരണത്തിന്റെയും, വിതരണത്തിന്റെയും, അറിവിന്റെ സൃഷ്ടിയുടേയും ഒരു ഉപാധിയാണു് വിവരസാങ്കേതികവിദ്യ. ഡിജിറ്റൽ രൂപത്തിലാക്കിയ വിവരത്തെ അടിസ്ഥാനമാക്കിയാണ് വിവരസാങ്കേതികവിദ്യ പ്രവർത്തിക്കുന്നത്.  ഡിജിറ്റൽ വിവരങ്ങളെ പ്രത്യേക ഘടനയിലാക്കിയാണ് കംമ്പ്യൂട്ടറുകളിൽ ഉപയോഗിക്കുക. അതിനായിട്ടാണ്, പരമ്പരാഗത റിലേഷണൽ ഡാറ്റബേസ് സംവിധാനങ്ങൾ ഉപയോഗിക്കുന്നത്.  കൃത്യമായ വിവരങ്ങൾ ഉപയോഗിച്ചുള്ള സംവിധാനങ്ങൾ പ്രവർത്തിപ്പിക്കാനാണ് അവ ഉപയോഗപ്പെടുത്തുന്നത്.  ഈ സംവിധാനങ്ങൾ വിവരങ്ങളെ ഒരു ഏകീകൃത രീതിയിൽ ശേഖരിക്കുന്നു, എസ്‍ക്യു‍എൽ പോലുള്ള കമ്പ്യൂട്ടർ ഭാഷകൾ ഉപയോഗിച്ച്, ഇത്തരത്തിലുള്ള വിവരങ്ങൾ താരതമ്യേനെ എളുപ്പത്തിൽ വിശകലനം ചെയ്യാവുന്നതാണ്. 

ആധുനിക കാലഘട്ടത്തിൽ വിവരത്തിന്റെ ഗുണത്തിലും വ്യാപ്തിയിലും വലിയ വളർച്ചയുണ്ടായി. ഉല്പാദനത്തിന്റെ എല്ലാ മേഖലകളിലും അറിവിനും വിവരത്തിനും വളരെ പ്രമുഖമായ സ്ഥാനം കൈവന്നിരിക്കുന്നു. മനുഷ്യസമൂഹത്തിന്റെ സാമൂഹ്യ-രാഷ്ട്രീയ-സാമ്പത്തിക താൽപ്പര്യങ്ങളുടെയും ആവശ്യങ്ങളുടെയും ഫലമായി, വിവരത്തിന്റെ അളവും വേഗതയും വൈവിദ്ധ്യവും വർദ്ധിച്ചു. ഇത് മനുഷ്യ സമൂഹത്തെ ഒരു വിവരവിപ്ലവ(Information revolution)ത്തിലേക്ക് നയിച്ചു. കൃഷിക്ക് തുടക്കമിട്ട നിയോലിത്തിക് വിപ്ലവം, മുതലാളിത്ത വ്യവസ്ഥക്ക് തുടക്കമിട്ട വ്യാവസായിക വിപ്ലവം എന്നിവയ്ക്ക് ശേഷം, മനുഷ്യ ചരിത്രത്തിലെ ഗതിയെ നിയന്ത്രിച്ച മൂന്നാമത്തെ പ്രധാന കാലഘട്ടമായി ഇതിനെ കരുതാം. വ്യവസായിക വിപ്ലവത്തിന്റെ നേട്ടം പ്രധാനമായി കൊയ്തത് ഭരണവർഗ്ഗമായിരുന്നെങ്കിലും, ശാസ്ത്രീയ സോഷ്യലിസം എന്ന ആശയത്തിനും അത് അടിത്തറ പാകി. വിവരവിപ്ലവം ആ ആശയത്തെ കൂടുതൽ മികവുറ്റതാക്കി അതിന്റെ പ്രയോഗസാദ്ധ്യത വർദ്ധിപ്പിക്കാൻ സഹായിക്കും. മൂലധനം രചിക്കാനായി എഴുതിയ കുറിപ്പുകളിൽ, യന്ത്രങ്ങൾ സ്വയം പ്രവർത്തിക്കുന്ന ഒരു സംവിധാനമായി മാറുന്നതിനെ കുറിച്ച് മാർക്സ് വിഭാവനം ചെയ്യുന്നുണ്ട്. അദ്ധ്വാനത്തിനുള്ള  പുതിയ മാർഗ്ഗങ്ങൾ രൂപപ്പെടുത്തുന്നതിന്റെ തുടർച്ചയായി, സാമൂഹിക അറിവ് പ്രയോഗിച്ചാകും സ്വയം പ്രവർത്തിക്കുന്ന യന്ത്രങ്ങൾ വികസിപ്പിക്കുകയെന്നും, അതിന്റെ ഫലമായി തൊഴിലിന്റെ അടിസ്ഥാനം അദ്ധ്വാനത്തിനു് പകരം, മൂലധനമായി മാറുമെന്നും അതിൽ പറയുന്നു. നിർമ്മിത ബുദ്ധിയുടെയും, ആധുനിക റോബോട്ടിന്റെയും വികസനത്തിലൂടെ വിവരവിപ്ലവം ആ ഘട്ടത്തിലേക്കാണ് നീങ്ങുന്നത്. എല്ലാ ജനങ്ങളുടെയും തത്സമയ പരസ്പര ബന്ധത്തിലേക്ക് നയിക്കുന്ന പ്രക്രിയയായി വിവരവിപ്ലവം വികസിച്ചേക്കാം.

കൂടിയ അളവിലുള്ള വിവരം, അവയ്ക്ക് പുതിയ സ്വഭാവ സവിശേഷതകൾ നല്കുന്നു. അതിലൂടെയാണ് ബിഗ് ഡാറ്റ(Big data)യുടെ ഉത്ഭവം. അവ ഉപയോഗിച്ചുള്ള വിവരവിശകലനത്തിനായി ഉതകുന്ന ഡാറ്റാ സയൻസ് എന്നറിയപ്പെടുന്ന ഒരു ശാസ്ത്രശാഖ കഴിഞ്ഞ രണ്ട് പതിറ്റാണ്ടുകളായി വികസിച്ചു വരികയാണ്.  ബിഗ് ഡാറ്റക്ക് ഏകമാനമായ ഒരു ഘടനയുണ്ടാകില്ല. വ്യത്യസ്തമായ സ്രോതസ്സുകളിൽ നിന്നും സമാഹരിക്കപ്പെടുന്നവയാണത്. ഒരു പ്രത്യേക ആവശ്യത്തിനായി, സാമൂഹ്യമാദ്ധ്യമങ്ങളിലെ അഭിപ്രായങ്ങൾ, വീഡിയോകൾ, സർക്കാരും, സ്ഥാപനങ്ങളും പ്രസിദ്ധീകരിക്കുന്ന വിവരങ്ങൾ, ഇന്റർനെറ്റിലെ വിവരങ്ങൾ, ഘടനാ രൂപത്തിലുള്ള വിവരങ്ങൾ എന്നിവയൊക്കെ ഒരു അരിച്ചെടുക്കലിലൂടെയും, ശുദ്ധീകരണ പ്രക്രീയതിലൂടെയും,  ബിഗ് ഡാറ്റയായി സമാഹരിക്കപ്പെടാം. ഇത്തരം വിവരങ്ങളെ പരസ്പരം ബന്ധപ്പെടുത്തുന്നതിലൂടെ ആ അവശ്യത്തിനായുള്ള ഒറ്റ വിവരസ്രോതസ്സായി ഉപയോഗപ്പെടുത്താം. പരമാവധി സ്രോതസ്സിലെ വിവരങ്ങൾ സമാഹരിച്ച് ബിഗ് ഡാറ്റ രൂപപ്പെടുത്തിയാൽ വിശകലനം കൂടുതൽ ഗുണനിലവാരമുള്ളതാകും. വിവരങ്ങളുടെ ഘടന, തരം, ലഭ്യമായ സാഹചര്യം എന്നിവയിലെ വൈവിദ്ധ്യങ്ങൾ കാരണം, ബിഗ് ഡാറ്റയെ പരമ്പരാഗത ഡാറ്റാബേസുകൾ വഴി കൈകാര്യം ചെയ്യാൻ കഴിയണമെന്നില്ല. ഹഡൂപ്പ്, ക്ലൗഡെറ, മോംഗോഡിബി പോലുള്ള സംവിധാനങ്ങളെ ഉപയോഗിച്ച് ബിഗ് ഡാറ്റയെ വിശകലനം ചെയ്യാം. അവക്ക് പ്രത്യേക പശ്ചാത്തല സൗകര്യങ്ങൾ ആവശ്യമാണ്, വിപുലമായ വിവരശേഖരത്തെ വിശകലനം ചെയ്യാൻ വലിയ തോതിലുള്ള ഗണനശേഷി ആവശ്യമുണ്ട്. ലോകത്ത് പലയിടങ്ങളിലുമായി സ്ഥാപിച്ച സർവ്വറുകൾ ശൃംഖല വഴി ബന്ധിപ്പിച്ച് ക്ലൗഡുകളായി പ്രവർത്തിപ്പിച്ചാണ് ആ ഗണനശേഷി ഒരുക്കുന്നത്. സാമൂഹ്യമാദ്ധ്യമങ്ങളിലെ അനേകം അഭിപ്രായങ്ങളിലൂടെയും, വിലമതിപ്പുകളിലൂടെയും, ഇഷ്‌ടങ്ങളിലൂടെയും രേഖപ്പെടുത്തിയ കാര്യങ്ങൾ കോർത്തിണക്കി നിഗമനങ്ങളിലെത്തിച്ചേരാൻ ഈ സംവിധാനങ്ങൾ ഉപകരിക്കും.  ലഭ്യമായ വിവരത്തിന്റെ അടിസ്ഥാനത്തില്‍ പല നിരീക്ഷണങ്ങളിലേക്കും നിലപാടുകളിലേക്കും എത്താനാകുമെന്നതാണ്  ബിഗ് ഡാറ്റയുടെ പ്രധാന ഗുണം.

ബിഗ് ഡാറ്റയുടെ വിശകലനം വിവിധ ഘട്ടങ്ങളിലായാണ് നടത്തുന്നത്.  വിശകലനത്തിന് ആവശ്യമായ വിവരത്തിലേക്ക് പ്രവേശിക്കുക എന്നതാണ് ആദ്യഘട്ടം. ഉപയോഗത്തിന് ആവശ്യമായ അനുമതികളും,  വിവരങ്ങൾ അരിച്ചെടുക്കുന്നതിലെ നൈപുണ്യവും ഇവിടെ പ്രധാനപ്പെട്ടതാണ്.  ലഭ്യമായ വിവരത്തെ വെച്ച് ഒരു വിവരമാതൃക രൂപീകരിച്ച് പരിപാലിക്കുക എന്നതാണ് അടുത്ത പടി.  ഇത് നല്ല വൈദഗ്ദ്ധ്യത്തോടെ ചെയ്യേണ്ട കാര്യമാണ്. ഈ മാതൃകയിൽ നിന്നും വിവിധ സ്ഥിതിവിവര രേഖകൾ അവതരിപ്പിക്കുക എന്ന തരതമ്യേനെ എളുപ്പമുള്ള ഘട്ടമാണ് അടുത്തത്.  വിവരങ്ങളിലെ ചില സ്വഭാവ സവിശേഷതകളെ കണ്ടെത്തി അതിന്റെ അടിസ്ഥാനത്തിൽ പ്രവചനം നടത്തുകയെന്നതാണ് നാലമത്തെ ഘട്ടം. വിശകലനം ചെയ്യപ്പെടുന്ന സാമൂഹ്യപ്രക്രീയയുടെ കാര്യത്തിൽ, വിവിധ സ്ഥാപനങ്ങൾ സ്വീകരിക്കേണ്ട മുൻകരുതലുകളെടുക്കുവാൻ ഈ ഘട്ടം സഹായിക്കും. മാറുന്ന സാഹചര്യങ്ങളെ പ്രവചിക്കാൻ സാധിക്കുന്ന ഗണനമാതൃക സൃഷ്ടിക്കുക എന്നതാണ് അഞ്ചാമത്തെ ഘട്ടം. ഓരോ സ്വഭാവ സവിഷേതകളിലും എന്തു മാറ്റം വരുത്തിയാൽ പ്രതീക്ഷിത ഫലം ലഭിക്കും എന്നു ഗണിക്കാൻ ഇതിലൂടെ സാധിക്കുന്നു.  ആസൂത്രണത്തിന് ആവശ്യമായ തീരുമാനങ്ങളെടുക്കാൻ ഇത് സഹായിക്കും. വിശകലനത്തിലൂടെ കണ്ടെത്തിയ ചില സവിശേഷതകളുടെ മാറ്റത്തിന്റെ ക്രമം കണ്ടെത്തി, അവയെ ക്രമീകരിച്ച് പ്രവചനത്തേയും, പ്രവചന മാതൃകയേയും കൂടുതൽ കൃത്യതയുള്ളതാക്കുക എന്നതാണ് ആറാമത്തെ ഘട്ടം.

ബിഗ് ഡാറ്റയുടെ സാദ്ധ്യത സമൂഹത്തിന്റെ പലതലങ്ങളിൽ ഉപയോഗിക്കുന്നുണ്ട്. ആരോഗ്യ മേഖല, സൈനിക മേഖല, ബാങ്കിംഗ് ഇൻഷുറൻസ് തുടങ്ങിയ സാമ്പത്തിക മേഖലകൾ, വിവിധ വിഷയങ്ങളിലെ ഗവേഷണം,  വ്യവസായിക രംഗം,  ഉല്പാദന രംഗം എന്നിവിടങ്ങളിൽ ബിഗ് ഡാറ്റ ഇന്ന് വ്യാപകമായി ഉപയോഗിച്ചു വരുന്നു.    കോവിഡ്-19-നെ പ്രതിരോധിക്കാനുള്ള പ്രവർത്തനം ആസൂത്രണം ചെയ്യുന്നതിന് പല രാജ്യങ്ങളും ബിഗ് ഡാറ്റ വിശകലനവും ഉപയോഗിച്ചിട്ടുണ്ട്.  സാമൂഹ്യ വിവരങ്ങൾ, കാലാവസ്ഥ, ആശുപത്രി വഴികിട്ടിയ വിവരങ്ങൾ എന്നിവ പഠിച്ച് ഡെങ്കി പനി സാദ്ധ്യത നാലാഴ്ച മുമ്പുവരെ പ്രവചിച്ച് മുന്നറിയിപ്പ് നല്കാനുള്ള സംവിധാനമുണ്ട്. വ്യക്തികളെ കേന്ദ്രീകരിച്ചുള്ള വിപണന തന്ത്രങ്ങൾക്കും, പരസ്യങ്ങൾക്കും ബിഗ് ഡാറ്റ വലിയ തോതിൽ ഉപയോഗിക്കുന്നു.  ഉപഭോക്താക്കളുടെ സാമൂഹ്യമാദ്ധ്യമങ്ങളിലൂടെയുള്ള പ്രതികരണങ്ങൾ വിശകലനം ചെയ്ത്, ഉല്പന്നങ്ങളിലും, സേവനങ്ങളിലും വരുത്തേണ്ട മാറ്റങ്ങൾ രൂപകല്പനചെയ്യാനും ബിഗ് ഡാറ്റ ഉപയോഗിക്കുന്നു. ഈ വിധത്തിൽ സമൂഹത്തിന്റെ നാനാതുറകളിൽ ഒഴിച്ചുകൂടാൻ പറ്റാത്ത സ്വാധീനം ബിഗ് ഡാറ്റ വിശകലനം ഇതിനകം നേടിയെടുത്തിട്ടുണ്ട്.

 

സംവേദനത്തിനും, വിവരസംപ്രേഷണത്തിനുമുള്ള സംവിധാനങ്ങൾ കരുത്താ‌ർജ്ജിക്കുന്നതിനോടൊപ്പം തന്നെ, അതേ സംവിധാനങ്ങൾ ഉപയോഗിച്ചു് വിവരം ചോർത്തപ്പെടാനുമുള്ള സാദ്ധ്യതകളും വർദ്ധിക്കുന്നുണ്ടു്. ഇതു് വിവരസുരക്ഷയെ കുറിച്ചുള്ള ആശങ്ക വ്യാപകമാക്കുന്നു..  നിയമസാധുത, ന്യായബോധം, സുതാര്യത, പരിമിതപ്പെടുത്തിയ ഉപയോഗം, പരിമിതപ്പെടുത്തിയ ശേഖരണം, കൃത്യത, പരിമിതപ്പെടുത്തിയ സംഭരണം, സമഗ്രത, സുരക്ഷക്കായുള്ള രഹസ്യാത്മകത, ഉത്തരവാദിത്തം എന്നീ അടിസ്ഥാന തത്വങ്ങളിലൂന്നിയ വിവരസുരക്ഷാ സംവിധാനവും വളരണം.

വിവരകേന്ദ്രീകരണം ഒഴിവാക്കപ്പെടണം. പരസ്പരബന്ധിതമായി പ്രാദേശികമായി സ്ഥാപിച്ച, പൂർണ്ണമായും സ്വതന്ത്ര സോഫ്റ്റ്‌വെയർ അധിഷ്ഠിതമായ  സംഭരണികളിൽ സംഭരിച്ചു്,  തുറന്ന മാനദണ്ഡങ്ങളുപയോഗിച്ചു് സംപ്രേഷണം ചെയ്യുന്നതും മെച്ചപ്പെട്ട വിവരസുരക്ഷ  ഉറപ്പാക്കും. സുതാര്യത ഉറപ്പുവരുത്തി, സ്വതന്ത്രമായ ഉപയോഗത്തിന് ലഭ്യമായ വിവര ശേഖരണം ഓപ്പൺ ഡാറ്റ എന്നാണറിയപ്പെടുന്നത്.

ലോകത്താകെയുള്ള ജനങ്ങൾക്ക് മെച്ചപ്പെട്ടൊരു ഭാവി ആസൂത്രണം ചെയ്ത് കെട്ടിപ്പടുക്കുവാൻ ഡാറ്റാ സയൻസും, നിർമ്മിത ബുദ്ധി ഉപയോഗിച്ചുള്ള സാങ്കേതികവിദ്യയും ഇനിയുമേറെ വികസിക്കേണ്ടതുണ്ട്.  അതിനായി വിപുലമായ വിവരശേഖരണ വിശകലനത്തിനുള്ള കഴിവ് ആര്‍ജ്ജിക്കേണ്ടതുണ്ട്. സ്വകാര്യത ഉറപ്പുവരുത്തിക്കൊണ്ടു തന്നെ അവയുടെ സ്വതന്ത്രമായ ലഭ്യത കാര്യക്ഷമമാക്കേണ്ടതും പ്രധാനമാണ്‌.  അതിനെ മാനവരാശിക്കാകെ  ഗുണകരമാകുന്ന സമത്വാധിഷ്ഠിതവും, വികേന്ദ്രീകൃതവും, ഏകോപിതവും, സമഗ്രവുമായ ആസൂത്രണത്തിന് ഉപയോഗിക്കാനായി ലഭ്യമാക്കേണ്ടത് അറിവിന്റെ കുത്തവല്ക്കരണത്തിനെതിരെയുള്ള പ്രവർത്തനത്തിന്റെ ഭാഗമാണ്‌. ആ നിലയ്ക്ക് അത് സാമ്രാജ്യശക്തികൾക്കെതിരെയുള്ള ചെറുത്തു നില്പിന്റെ മറ്റൊരു രൂപമായി മാറുന്നു.