સાયન્સ ફેર : ડેટા સાયન્સનું ભવિષ્ય ઓટોમેટેડ મશીન લર્નિંગમાં રહેલું છે

જ્વલંત નાયક

ઇલેક્શન વખતે સેફોલોજીસ્ટ્સની જાતજાતની આગાહીઓ વિષે ચર્ચાઓ ચાલતી રહી. પરંતુ આવી ચર્ચાઓમાં ઘણીવાર મહત્વનો મુદ્દો વિસરાઈ જાય છે! દાખલા તરીકે પરિણામોની આગાહીઓ વિષે વાત થઇ પણ એ આગાહીઓ જેના આધારે થતી હોય છે, એ “ડેટા સાયન્સ” વિષે ભાગ્યે જ કોઈએ રસ દાખવ્યો.. એકવીસમી સદીમાં જો “નોલેજ ઇઝ પાવર”નું સૂત્ર સાચું હોય, તો બીજું એક સૂત્ર “ડેટા ઇઝ નોલેજ” પણ એટલું જ સાચું છે! આવનારા સમયમાં જે ડેટા સાયન્સમાં પાવરફુલ હશે, એ તમામ ક્ષેત્રે અગ્રગણ્ય રહેશે.

આમ તો નોલેજ (જ્ઞાન) અને ઇન્ફોર્મેશન (માહિતી) વચ્ચે બહુ મોટો ફરક છે. કોઈ પણ વિષય અંગેનો ડેટા, એ માત્ર એક માહિતી જ ગણાય. પરંતુ આધુનિક યુગમાં કોઈ એક વિષયમાં અનેક પ્રકારની માહિતીઓનું આકલન જ જ્ઞાન સુધી પહોંચવાનો રાજમાર્ગ છે. કોઈ એક સમૂહ, સમાજ, પ્રદેશ કે રાષ્ટ્રના નાગરિકોની વિવિધ વિષયોને લગતી અનેક પ્રકારની માહિતી મેળવવામાં આવે, અને આ માહિતીઓને આધારે સરકારી નીતિઓ ઘડાય, કોર્પોરેટ જાયન્ટ્સની માર્કેટિંગ સ્કીમ્સ અમલમાં આવે અથવા રાજકીય પક્ષોની સ્ટ્રેટેજી ઘડાય, એ બધું એક ખાસ પ્રકારના સાયન્ટિફિક પ્રોસેસને આભારી છે. આ પ્રોસેસ એટલે ‘ડેટા સાયન્સ’ અથવા ‘ડેટા ડ્રીવન સાયન્સ’. વિવિધ પ્રકારે ઉપલબ્ધ થયેલા ડેટાને સમજીને, એમાંથી પોતાને કામની બાબતોનું જ્ઞાન મેળવવાની આખી ક્રિયા ‘ડેટા સાયન્સ’ તરીકે ઓળખાય છે. આ આખા વિજ્ઞાનનાં પાયામાં માહિતીનો ઢગલો અને ગણિતની કેટલીક ફોર્મ્યુલાઝ રહેલી છે, અને આ બધું હોય છે કમ્પ્યુટર કોડીંગના સ્વરૂપમાં.

કમ્પ્યુટરમાં વપરાતી પ્રોગ્રામિંગ લેન્ગ્વેજ આપણી સાદી અંગ્રેજી ભાષા જેવી નથી એ જાણીતી વાત છે. આથી લગભગ દરેક પ્રોગ્રામિંગ લેન્ગ્વેજમાં કોન્ટેકસ્ટ ફ્રી ગ્રામર માટે સ્પેશિયલ નોટેશન ટેકનિકનો ઉપયોગ થાય છે. આ નોટેશન ટેકનિક (જેના મૂળિયા પાણિનીના સંસ્કૃત વ્યાકરણમાં હોવાનું મનાય છે) “બેકસ-નોર ફોર્મ” (BNF નોટેશન્સ) તરીકે ઓળખાય છે. અહીં બેકસ અને નોર એ બે કોમ્પ્યુટર વિજ્ઞાનીઓના નામો છે. આ પૈકીના પીટર નોર નામના ડચ કોમ્પ્યુટર સાયન્ટિસ્ટ દ્વારા ઇસ ૧૯૬૦માં સૌપ્રથમ વાર “ડેટા સાયન્સ” નામનો શબ્દ વાપરવામાં આવ્યો. ઇસ ૧૯૭૪ પીટર નોરે પબ્લિશ કરેલા નિબંધ “ક્ન્સાઈઝ સર્વે ઓફ કોમ્પ્યુટર મેથડ્સ”માં ‘ડેટા સાયન્સ’ શબ્દનો બહોળો ઉપયોગ કરવામાં આવ્યો, ત્યાર બાદ દુનિયાભરના કમ્પ્યુટર નિષ્ણાંતોનું ધ્યાન આ શબ્દ ઉપર ચોંટ્યું. આપણે વાતવાતમાં જે આર્ટીફીશીયલ ઇન્ટેલીજન્સનાં ફીફાં ખાંડતા હોઈએ છીએ, એનો આત્મા એટલે ડેટા સાયન્સ.

ડેટા સાયન્સમાં પણ જો કોઈ લેટેસ્ટ ટ્રેન્ડ હોય તો એ છે ઓટોમેટેડ મશીન લર્નિંગ – Automated machine learning, જે ટૂંકમાં AutoML તરીકે ઓળખાય છે. પહેલા ‘મશીન લર્નિંગ’ એટલે શું એ સમજીએ.

મશીન લર્નિંગ એટલે ભૂતકાળમાં એકઠા કરાયેલ ડેટાનું પૃથક્કરણ કરીને નવું અલગોરિધમ વિકસાવવાની પ્રક્રિયા. લગભગ દરેક પ્રકારના ઓર્ગેનાઈઝેશનમાં આ પ્રકારના ટેકનિકલ એનાલીસીસની જરૂર પડે છે. દાખલા તરીકે કોઈ એક શહેરના લોકોનો સ્વાસ્થ્ય સંબંધી ડેટા ઉપલબ્ધ હોય, તો એ શહેરમાં કેટલા ટકા લોકોને હાઈ કોલેસ્ટેરોલની સમસ્યા છે, એ ઉપલબ્ધ ડેટાના પ્રોસેસ દ્વારા જાણી શકાય છે. અને આ ઉપરથી, એ શહેરના લોકોમાં સરેરાશ કેટલી ઉમર પછી હાર્ટ એટેકનું જોખમ વધુ ગણાય, એ માટેનું અલગોરિધમ વિકસાવવામાં આવે, તો એને ‘મશીન લર્નિંગ’ કહેવાય. પરંતુ ટેકનોલોજીને પણ કેટલીક પોતીકી સમસ્યાઓ છે. મશીન લર્નિંગ દ્વારા થતા એનાલીસીસ માટે બહુ મોટી સંખ્યામાં ડેટા સાયન્ટીસ્ટ્સની જરૂર પડે. વળી આ નિષ્ણાંતો ચોટલી બાંધીને કામ કરે તો ય ડેટા એનાલીસીસ કરીને મેન્યુઅલ કોડીંગ દ્વારા અલગોરિધમ વિકસાવવામાં બહુ લાંબો સમય લાગી જાય. કદાચ ત્યાં સુધીમાં તો જેનો અભ્યાસ કરવાનો હોય એ જનસમૂહની આખી લીવીંગ પેટર્ન બદલાઈ ગઈ હોય એમ પણ બને! અને આવું થાય તો તો બધી મહેનત પાણીમાં! એના કરતા અલગોરિધમ વિકસાવવાનું કામ પણ કોઈક હાઈ એન્ડ કમ્પ્યુટરને જ સોંપી દઈએ તો?!

મશીન લર્નિંગનો પ્રોસેસ ઝડપી બનાવવા માટે ‘ડેટા રોબોટ’નાં ઉપયોગનું ચલણ વધતું જાય છે. ડેટા રોબોટ એટલે ખાસ પ્રકારના રોબોટિક સોફ્ટવેર્સ, બીજા શબ્દોમાં ચોક્કસ પ્રક્રિયા માટેના કોડેડ કમાન્ડસનો સેટ. રોબોટ સોફ્ટવેર્સ દ્વારા મિકેનીકલ ડિવાઈસ અને ઈલેક્ટ્રોનિક સિસ્ટમને કોઈ એક ખાસ પ્રોસેસ કરવા માટેના કમાન્ડ આપી શકાય છે. જ્યારે વિશાળ જથ્થામાં કોઈ ડેટા ઉપલબ્ધ હોય, અને આ ડેટામાં કોઈક ખાસ પ્રકારની પેટર્ન રચાતી હોય, ત્યારે ડેટા સાયન્ટિસ્ટસ્ આવી પેટર્ન ઓળખવામાં થાપ ખાઈ જાય, એ બનવાજોગ છે. પરંતુ રોબોટ સોફ્ટવેર્સ આવી ભૂલ કરતા નથી. દાખલા તરીકે ૧૫ લાખ લોકોનો ડેટા એનાલિસીસ કરીને ડાયાબિટીસનાં પ્રમાણ વિષે જાણકારી મળી શકે છે. પરંતુ ડેટા રોબોટ્સ દ્વારા પ્રોસેસ કરવામાં આવે તો આ સમૂહના ડાયાબિટીક લોકોમાં આંખે ઝાંખ વળવાને કારણે થતા રોડ એક્સિડન્ટસ્ વિષે પણ ચોક્કસ માહિતી મળે છે, જેના આધારે ટકાવારી આધારિત આંકડાઓની એક ચોક્કસ પેટર્ન મેળવી શકાય છે! આ તો સાવ સામાન્ય ઉદાહરણ હતું, પરંતુ જટિલ ઇન્ડસ્ટ્રીયલ પ્રોસેસમાં ડેટા રોબોટ્સ દ્વારા થતા આકલનો દ્વારા અનેક ડેટા પેટર્ન્સ મેળવી શકાય છે, અને એ માટેનું અતિશય જટિલ અલગોરિધમ વિકસાવીને ભવિષ્ય અંગેની તૈયારી કરી શકાય છે!

એ સિવાય AutoML સાયબર થ્રેટ સામે પણ રક્ષણ આપશે. AutoMLથી સજ્જ આર્ટીફીશીયલ ઇન્ટેલીજન્સ વિશાળ નેટવર્કસ્ ઉપર સતત ચાંપતી નજર રાખી શકે છે. અને ક્યાંય કોઈક અજાણી પેટર્ન વિકસતી દેખાય કે તરત એનો તાગ મેળવી લે છે. નિષ્ણાંતો માને છે કે બહુ ઝડપથી AutoML ડેટા સાયન્સનાં ક્ષેત્રે એસેન્શિયલ કોમોડિટી ગણાવા માંડશે.


શ્રી જ્વલંત નાયકનો સંપર્ક jwalantmax@gmail.com પર થઇ શકે છે.


Disclaimer: The images / videos in this post have been taken from net for non-commercial purpose. If there is any breach of copy right, and would be brought to our notice, it will be removed from here.

Facebooktwitterredditpinterestlinkedinmail

2 comments for “સાયન્સ ફેર : ડેટા સાયન્સનું ભવિષ્ય ઓટોમેટેડ મશીન લર્નિંગમાં રહેલું છે

  1. Niranjan Korde
    June 28, 2019 at 10:41 am

    ખૂબ ઊંડાણપૂર્વક મશીન લર્નિંગ વિશે જણાવ્યું છે. હવે પછી રોબોટીક ટેકનોલોજી માં ભરપૂર ઉપયોગ કરી માનવી જીવન ને વધુ સરળ અને સટીક પરિણામ મળે તેવા પ્રયાસ અવિરત સતત ચાલુ છે અને નવા નવા આયામ ઉમેરાતા જાય છે.
    પરંતુ મશીન લર્નીગના દુષપરિણામ પણ માણસના જીવનને ઉદ્ધવત કરી શકે છે તેનું જ્વલંત ઉદાહરણ Deep Fake નો વિકસિત થઈ ચૂક્યો છે. જી હા, આપ જો તે વિશે વાંચશો તો માલુમ પડશે કે કોઈ પણ વ્યક્તિના અનેક ફોટોગ્રાફ એકત્ર કરી સોફ્ટવેર ની મદદ થી વિડીયો બનાવી શકો છો જેમાં એ વ્યક્તિના અવાજને ડબીગ કરી Text to Speech ની મદદ થી આપની ઈચ્છા મુજબ બોલાવી શકો છો કે જે તે વ્યક્તિ કદી બોલી જ ન હોય. અને તેમ કરીને ખાસ કરીને જાહેર જીવન માં મોટી વ્યક્તિ ને આ Deep fake નો ઉપયોગ કરી બદનામ કરી શકો છો.
    ખેર fake Video ને ઓળખવા પણ software બની રહ્યા છે.
    ઈશ્વરને પ્રાર્થના કે માનવી વિકસિત Technology નો સદુપયોગ કરે.
    આપનો નિરંજન કોર્ડ

  2. Niranjan Korde
    June 28, 2019 at 11:26 am

    Deep fake video link is given below. One can understand how it can bring dangerous results.

    https://youtu.be/gLoI9hAX9dw

Leave a Reply

You have to agree to the comment policy.

This site uses Akismet to reduce spam. Learn how your comment data is processed.