સાયન્સ ફેર :: ડેટા સાયન્સ : નોલેજ ઇઝ પાવર… અને "ડેટા ઇઝ ધી નોલેજ"!

જ્વલંત નાયક

ગુજરાત ઇલેક્શન વખતે જાતજાતની આંકડેબાજી સમાચારો-સોશિયલ મીડિયામાં આવતી રહી. અને સોશિયલ મીડિયામાં દરેક ભળતી-સળતી ચીજવસ્તુઓને આધારકાર્ડ સાથે ‘લિંક’ કરાવવાની સૂચનાઓ આપતી રમૂજો પણ ફરતી રહી. ઈલેકશનની આંકડાબાજી અને બેંક એકાઉન્ટ્સના આધારકાર્ડ લિંક-અપ્સ વચ્ચે શું સામ્ય છે, ખબર છે? સોશિયલ મીડિયાની રમૂજોમાં ઘણીવાર મહત્વનો મુદ્દો વિસરાઈ જાય છે! ઉપર જણાવેલી બન્ને બાબતોને પહેલી નજરે એકબીજા સાથે કોઈ લેવાદેવા નથી, તેમ છતાં આ બાબતો જેની સાથે સંકળાયેલી છે એ શબ્દ છે “ડેટા સાયન્સ”. એકવીસમી સદીમાં જો “નોલેજ ઇઝ પાવર”નું સૂત્ર સાચું હોય, તો બીજું એક સૂત્ર “ડેટા ઇઝ નોલેજ” પણ એટલું જ સાચું છે!

આમ તો નોલેજ (જ્ઞાન) અને ઇન્ફોર્મેશન (માહિતી) વચ્ચે બહુ મોટો ફરક છે. કોઈ પણ વિષય અંગેનો ડેટા, એ માત્ર એક માહિતી જ ગણાય. પરંતુ આધુનિક યુગમાં કોઈ એક વિષયમાં અનેક પ્રકારની માહિતીઓનું આકલન જ જ્ઞાન સુધી પહોંચવાનો રાજમાર્ગ છે. કોઈ એક સમૂહ, સમાજ, પ્રદેશ કે રાષ્ટ્રના નાગરિકોની વિવિધ વિષયોને લગતી અનેક પ્રકારની માહિતી મેળવવામાં આવે, અને આ માહિતીઓને આધારે સરકારી નીતિઓ ઘડાય, કોર્પોરેટ જાયન્ટ્સની માર્કેટિંગ સ્કીમ્સ અમલમાં આવે અથવા રાજકીય પક્ષોની સ્ટ્રેટેજી ઘડાય, એ બધું એક ખાસ પ્રકારના સાયન્ટિફિક પ્રોસેસને આભારી છે. આ પ્રોસેસ એટલે ‘ડેટા સાયન્સ’ અથવા ‘ડેટા ડ્રીવન સાયન્સ’. વિવિધ પ્રકારે ઉપલબ્ધ થયેલા ડેટાને સમજીને, એમાંથી પોતાને કામની બાબતોનું જ્ઞાન મેળવવાની આખી ક્રિયા ‘ડેટા સાયન્સ’ તરીકે ઓળખાય છે. ડેટા સાયન્સ કઈ રીતે કામ લાગે છે? એક સરળ ઉદાહરણ દ્વારા સમજીએ.

કોઈ એક વેપારી એક સંસ્થાની બહાર ખાણી-પીણીની દુકાન ખોલવા માંગે છે. હવે પોતાની દુકાનમાં કયા ખાદ્ય પદાર્થો વેચવા, એ નક્કી કરવા માટે એની પાસે પેલી સંસ્થા વિશેની માહિતી-ડેટા હોવો જોઈએ. જો એ કોઈ શૈક્ષણિક સંસ્થા હોય અને એમાં પ્રાથમિક શાળાના બાળકો ભણતા હોય તો ટીકડી-ગોળા-પીપરમીંટ જેવી ચીજોનું વેચાણ વધુ થાય. એ સંસ્થામાં જો મોટી ઉંમરના વિદ્યાર્થીઓ અભ્યાસ કરતા હોય તો ઠંડા પીણા અને ફાસ્ટફૂડની આઇટમ્સ વધુ વેચાય. અને એ સંસ્થામાં જો સરકારી ઓફિસો આવેલી હોય તો પાન-માવા-સિગરેટ સાથે બ્રેડ-પકોડા-સમોસા જેવા દેશી ફાસ્ટફૂડનું વેચાણ વધુ થાય! આ તો બહુ સાદું ઉદાહરણ થયું, હવે જરા વધુ ઊંડાણપૂર્વક સમજીએ.

ઇસ ૨૦૧૪ની ભારતીય લોકસભા ચૂંટણીમાં ૧૫ કરોડ યુવા મતદારો એવા હતા, જેમને પ્રથમ વખત મતદાનનો અધિકાર મળેલો. એનો અર્થ એમ થાય કે ભારત પાસે ઓછામાં ઓછાં ૧૫ કરોડ યુવાનો એવા છે જે ૧૮થી ૨૩ વર્ષના એજ ગ્રુપમાં આવે છે. હવે જો કોઈ પક્ષ હોશિયારી વાપરીને એવી ચુનાવી રણનીતિ ઘડી કાઢે, જેમાં આ એઈજ ગ્રુપના લોકો માટે વધારે વાત કરવામાં આવે… આ એઈજ ગ્રુપના લોકોને વધુ ફાયદો થાય એવી યોજનાઓ જાહેર કરવામાં આવે, તો એ પક્ષ એકસાથે ૧૫ કરોડ વોટ્સ પોતાના તરફ આકર્ષી શકે! આ તો રાજકારણની વાત થઇ. પરંતુ આજ ડેટાનો ઉપયોગ કરીને કોર્પોરેટ જગત પોતાની સ્ટ્રેટેજી ઘડતું હોય છે. જેમકે મોબાઈલ નેટવર્ક કે ઇન્ટરનેટ સેવા પૂરી પાડતી કંપનીઓ આવા ડેટાનો ઉપયોગ કરીને જ પોતાના ક્લાયન્ટ્સ માટે નવી નવી સ્કીમો બહાર પાડે છે. જો કે કોર્પોરેટ જાયન્ટ્સ (અને હવે તો અમુક સરકારી ખાતાઓ પણ) જે ડેટા સાયન્સ આધારિત તારણો મેળવે છે, એ ખાસ્સી જટિલ પ્રક્રિયા બાદ મેળવવામાં આવે છે. અને ડેટા પ્રોસેસ સિસ્ટમ માટે ખાસ પ્રકારની ટેકનોલોજીઝ-સોફ્ટવેર્સ અને નિષ્ણાંતોનો બહોળા પાયે ઉપયોગ થઇ રહ્યો છે.

કોમ્યુટરમાં વપરાતી પ્રોગ્રામિંગ લેન્ગ્વેજ આપણી સાદી અંગ્રેજી ભાષા જેવી નથી એ જાણીતી વાત છે. આથી લગભગ દરેક પ્રોગ્રામિંગ લેન્ગ્વેજમાં કોન્ટેકસ્ટ ફ્રી ગ્રામર માટે સ્પેશિયલ નોટેશન ટેકનિકનો ઉપયોગ થાય છે. આ નોટેશન ટેકનિક (જેના મૂળિયા પાણિનીના સંસ્કૃત વ્યાકરણમાં હોવાનું મનાય છે) “બેકસ-નોર ફોર્મ” (બીએનએફ નોટેશન્સ) તરીકે ઓળખાય છે. અહીં બેકસ અને નોર એ બે કોમ્પ્યુટર વિજ્ઞાનીઓના નામો છે. આ પૈકીના પીટર નોર નામના ડચ કોમ્પ્યુટર સાયન્ટિસ્ટ દ્વારા ઇસ ૧૯૬૦માં સૌપ્રથમ વાર “ડેટા સાયન્સ” નામનો શબ્દ વાપરવામાં આવ્યો.

Image result for data science

ઇસ ૧૯૭૪ પીટર નોરે પબ્લિશ કરેલા નિબંધ “ક્ન્સાઈઝ સર્વે ઓફ કોમ્પ્યુટર મેથડ્સ“માં ‘ડેટા સાયન્સ’ શબ્દનો બહોળો ઉપયોગ કરવામાં આવ્યો, ત્યાર બાદ દુનિયાભરના કમ્પ્યુટર નિષ્ણાંતોનું ધ્યાન આ શબ્દ ઉપર ચોંટ્યું. જો કે વિશ્વવિખ્યાત ‘ફોર્બ્સ’ મેગેઝીનમાં લેખક ગીલ પ્રેસ લખે છે કે ‘ડેટા સાયન્સ’ એ કોઈ નવું શોધાયેલું શાસ્ત્ર નથી, બલકે માહિતી મેળવવાની જૂની પદ્ધતિને કોમ્પ્યુટરના આવિષ્કારને પ્રતાપે એક વ્યવસ્થિત સ્વરૂપ અને ચોક્કસ નામ મળ્યા છે એટલું જ! બાકી એ પહેલા પણ વિવિધ માહિતીઓના બિઝનેસ એનાલીસીસ જેવી પ્રક્રિયાઓ તો હતી જ! ગીલ પ્રેસની વાતમાં દમ તો છે જ, પણ માહિતીના પૃથક્કરણની જૂની પદ્ધતિ કોમ્પ્યુટરના આવિષ્કાર બાદ ખૂબ સચોટ અને અતિશય ઝડપી બની છે. પરિણામે પહેલા જે પ્રકારનું પૃથક્કરણ અશક્ય લાગતું હતું, એ હવે બહુ સરળતાથી થઇ જાય છે. પરિણામે આધુનિક સમયમાં ડેટા સાયન્સને કોમ્પ્યુટર સાયન્સની જ એક ઉપશાખા તરીકે સ્વીકારવામાં આવ્યું છે.

અત્યારે દુનિયાની દરેક ઇન્ડસ્ટ્રી અને નાની-મોટી અસંખ્ય સંસ્થાઓ ડેટા સાયન્સ પર આધાર રાખે છે. અમુક નિષ્ણાંતો તો ડેટા સાયન્સને આર્ટીફીશીયલ ઇન્ટેલીજન્સ ગણાવે છે.

આવતા સપ્તાહે ડેટા સાયન્સના લેટેસ્ટ ટ્રેન્ડ્સ વિષે જાણીશું.


શ્રી જ્વલંત નાયકનો સંપર્ક jwalantmax@gmail.com પર થઇ શકે છે.


નોંધઃ અહીં મૂકેલ ઇમેજ નેટ પરથી લેખના સંદર્ભને વધારે સારી રીતે સમજવા પૂરતી લીધેલ છે. તેના પ્રકાશાનાધિકાર મૂળ રચયિતાના અબાધિત છે.

Facebooktwittergoogle_plusredditpinterestlinkedinmail

Leave a Reply

You have to agree to the comment policy.