





જ્વલંત નાયક
ઇલેક્શન વખતે સેફોલોજીસ્ટ્સની જાતજાતની આગાહીઓ વિષે ચર્ચાઓ ચાલતી રહી. પરંતુ આવી ચર્ચાઓમાં ઘણીવાર મહત્વનો મુદ્દો વિસરાઈ જાય છે! દાખલા તરીકે પરિણામોની આગાહીઓ વિષે વાત થઇ પણ એ આગાહીઓ જેના આધારે થતી હોય છે, એ “ડેટા સાયન્સ” વિષે ભાગ્યે જ કોઈએ રસ દાખવ્યો.. એકવીસમી સદીમાં જો “નોલેજ ઇઝ પાવર”નું સૂત્ર સાચું હોય, તો બીજું એક સૂત્ર “ડેટા ઇઝ નોલેજ” પણ એટલું જ સાચું છે! આવનારા સમયમાં જે ડેટા સાયન્સમાં પાવરફુલ હશે, એ તમામ ક્ષેત્રે અગ્રગણ્ય રહેશે.

આમ તો નોલેજ (જ્ઞાન) અને ઇન્ફોર્મેશન (માહિતી) વચ્ચે બહુ મોટો ફરક છે. કોઈ પણ વિષય અંગેનો ડેટા, એ માત્ર એક માહિતી જ ગણાય. પરંતુ આધુનિક યુગમાં કોઈ એક વિષયમાં અનેક પ્રકારની માહિતીઓનું આકલન જ જ્ઞાન સુધી પહોંચવાનો રાજમાર્ગ છે. કોઈ એક સમૂહ, સમાજ, પ્રદેશ કે રાષ્ટ્રના નાગરિકોની વિવિધ વિષયોને લગતી અનેક પ્રકારની માહિતી મેળવવામાં આવે, અને આ માહિતીઓને આધારે સરકારી નીતિઓ ઘડાય, કોર્પોરેટ જાયન્ટ્સની માર્કેટિંગ સ્કીમ્સ અમલમાં આવે અથવા રાજકીય પક્ષોની સ્ટ્રેટેજી ઘડાય, એ બધું એક ખાસ પ્રકારના સાયન્ટિફિક પ્રોસેસને આભારી છે. આ પ્રોસેસ એટલે ‘ડેટા સાયન્સ’ અથવા ‘ડેટા ડ્રીવન સાયન્સ’. વિવિધ પ્રકારે ઉપલબ્ધ થયેલા ડેટાને સમજીને, એમાંથી પોતાને કામની બાબતોનું જ્ઞાન મેળવવાની આખી ક્રિયા ‘ડેટા સાયન્સ’ તરીકે ઓળખાય છે. આ આખા વિજ્ઞાનનાં પાયામાં માહિતીનો ઢગલો અને ગણિતની કેટલીક ફોર્મ્યુલાઝ રહેલી છે, અને આ બધું હોય છે કમ્પ્યુટર કોડીંગના સ્વરૂપમાં.
કમ્પ્યુટરમાં વપરાતી પ્રોગ્રામિંગ લેન્ગ્વેજ આપણી સાદી અંગ્રેજી ભાષા જેવી નથી એ જાણીતી વાત છે. આથી લગભગ દરેક પ્રોગ્રામિંગ લેન્ગ્વેજમાં કોન્ટેકસ્ટ ફ્રી ગ્રામર માટે સ્પેશિયલ નોટેશન ટેકનિકનો ઉપયોગ થાય છે. આ નોટેશન ટેકનિક (જેના મૂળિયા પાણિનીના સંસ્કૃત વ્યાકરણમાં હોવાનું મનાય છે) “બેકસ-નોર ફોર્મ” (BNF નોટેશન્સ) તરીકે ઓળખાય છે. અહીં બેકસ અને નોર એ બે કોમ્પ્યુટર વિજ્ઞાનીઓના નામો છે. આ પૈકીના પીટર નોર નામના ડચ કોમ્પ્યુટર સાયન્ટિસ્ટ દ્વારા ઇસ ૧૯૬૦માં સૌપ્રથમ વાર “ડેટા સાયન્સ” નામનો શબ્દ વાપરવામાં આવ્યો. ઇસ ૧૯૭૪ પીટર નોરે પબ્લિશ કરેલા નિબંધ “ક્ન્સાઈઝ સર્વે ઓફ કોમ્પ્યુટર મેથડ્સ”માં ‘ડેટા સાયન્સ’ શબ્દનો બહોળો ઉપયોગ કરવામાં આવ્યો, ત્યાર બાદ દુનિયાભરના કમ્પ્યુટર નિષ્ણાંતોનું ધ્યાન આ શબ્દ ઉપર ચોંટ્યું. આપણે વાતવાતમાં જે આર્ટીફીશીયલ ઇન્ટેલીજન્સનાં ફીફાં ખાંડતા હોઈએ છીએ, એનો આત્મા એટલે ડેટા સાયન્સ.
ડેટા સાયન્સમાં પણ જો કોઈ લેટેસ્ટ ટ્રેન્ડ હોય તો એ છે ઓટોમેટેડ મશીન લર્નિંગ – Automated machine learning, જે ટૂંકમાં AutoML તરીકે ઓળખાય છે. પહેલા ‘મશીન લર્નિંગ’ એટલે શું એ સમજીએ.

મશીન લર્નિંગ એટલે ભૂતકાળમાં એકઠા કરાયેલ ડેટાનું પૃથક્કરણ કરીને નવું અલગોરિધમ વિકસાવવાની પ્રક્રિયા. લગભગ દરેક પ્રકારના ઓર્ગેનાઈઝેશનમાં આ પ્રકારના ટેકનિકલ એનાલીસીસની જરૂર પડે છે. દાખલા તરીકે કોઈ એક શહેરના લોકોનો સ્વાસ્થ્ય સંબંધી ડેટા ઉપલબ્ધ હોય, તો એ શહેરમાં કેટલા ટકા લોકોને હાઈ કોલેસ્ટેરોલની સમસ્યા છે, એ ઉપલબ્ધ ડેટાના પ્રોસેસ દ્વારા જાણી શકાય છે. અને આ ઉપરથી, એ શહેરના લોકોમાં સરેરાશ કેટલી ઉમર પછી હાર્ટ એટેકનું જોખમ વધુ ગણાય, એ માટેનું અલગોરિધમ વિકસાવવામાં આવે, તો એને ‘મશીન લર્નિંગ’ કહેવાય. પરંતુ ટેકનોલોજીને પણ કેટલીક પોતીકી સમસ્યાઓ છે. મશીન લર્નિંગ દ્વારા થતા એનાલીસીસ માટે બહુ મોટી સંખ્યામાં ડેટા સાયન્ટીસ્ટ્સની જરૂર પડે. વળી આ નિષ્ણાંતો ચોટલી બાંધીને કામ કરે તો ય ડેટા એનાલીસીસ કરીને મેન્યુઅલ કોડીંગ દ્વારા અલગોરિધમ વિકસાવવામાં બહુ લાંબો સમય લાગી જાય. કદાચ ત્યાં સુધીમાં તો જેનો અભ્યાસ કરવાનો હોય એ જનસમૂહની આખી લીવીંગ પેટર્ન બદલાઈ ગઈ હોય એમ પણ બને! અને આવું થાય તો તો બધી મહેનત પાણીમાં! એના કરતા અલગોરિધમ વિકસાવવાનું કામ પણ કોઈક હાઈ એન્ડ કમ્પ્યુટરને જ સોંપી દઈએ તો?!
મશીન લર્નિંગનો પ્રોસેસ ઝડપી બનાવવા માટે ‘ડેટા રોબોટ’નાં ઉપયોગનું ચલણ વધતું જાય છે. ડેટા રોબોટ એટલે ખાસ પ્રકારના રોબોટિક સોફ્ટવેર્સ, બીજા શબ્દોમાં ચોક્કસ પ્રક્રિયા માટેના કોડેડ કમાન્ડસનો સેટ. રોબોટ સોફ્ટવેર્સ દ્વારા મિકેનીકલ ડિવાઈસ અને ઈલેક્ટ્રોનિક સિસ્ટમને કોઈ એક ખાસ પ્રોસેસ કરવા માટેના કમાન્ડ આપી શકાય છે. જ્યારે વિશાળ જથ્થામાં કોઈ ડેટા ઉપલબ્ધ હોય, અને આ ડેટામાં કોઈક ખાસ પ્રકારની પેટર્ન રચાતી હોય, ત્યારે ડેટા સાયન્ટિસ્ટસ્ આવી પેટર્ન ઓળખવામાં થાપ ખાઈ જાય, એ બનવાજોગ છે. પરંતુ રોબોટ સોફ્ટવેર્સ આવી ભૂલ કરતા નથી. દાખલા તરીકે ૧૫ લાખ લોકોનો ડેટા એનાલિસીસ કરીને ડાયાબિટીસનાં પ્રમાણ વિષે જાણકારી મળી શકે છે. પરંતુ ડેટા રોબોટ્સ દ્વારા પ્રોસેસ કરવામાં આવે તો આ સમૂહના ડાયાબિટીક લોકોમાં આંખે ઝાંખ વળવાને કારણે થતા રોડ એક્સિડન્ટસ્ વિષે પણ ચોક્કસ માહિતી મળે છે, જેના આધારે ટકાવારી આધારિત આંકડાઓની એક ચોક્કસ પેટર્ન મેળવી શકાય છે! આ તો સાવ સામાન્ય ઉદાહરણ હતું, પરંતુ જટિલ ઇન્ડસ્ટ્રીયલ પ્રોસેસમાં ડેટા રોબોટ્સ દ્વારા થતા આકલનો દ્વારા અનેક ડેટા પેટર્ન્સ મેળવી શકાય છે, અને એ માટેનું અતિશય જટિલ અલગોરિધમ વિકસાવીને ભવિષ્ય અંગેની તૈયારી કરી શકાય છે!
એ સિવાય AutoML સાયબર થ્રેટ સામે પણ રક્ષણ આપશે. AutoMLથી સજ્જ આર્ટીફીશીયલ ઇન્ટેલીજન્સ વિશાળ નેટવર્કસ્ ઉપર સતત ચાંપતી નજર રાખી શકે છે. અને ક્યાંય કોઈક અજાણી પેટર્ન વિકસતી દેખાય કે તરત એનો તાગ મેળવી લે છે. નિષ્ણાંતો માને છે કે બહુ ઝડપથી AutoML ડેટા સાયન્સનાં ક્ષેત્રે એસેન્શિયલ કોમોડિટી ગણાવા માંડશે.
શ્રી જ્વલંત નાયકનો સંપર્ક jwalantmax@gmail.com પર થઇ શકે છે.
Disclaimer: The images / videos in this post have been taken from net for non-commercial purpose. If there is any breach of copy right, and would be brought to our notice, it will be removed from here.
ખૂબ ઊંડાણપૂર્વક મશીન લર્નિંગ વિશે જણાવ્યું છે. હવે પછી રોબોટીક ટેકનોલોજી માં ભરપૂર ઉપયોગ કરી માનવી જીવન ને વધુ સરળ અને સટીક પરિણામ મળે તેવા પ્રયાસ અવિરત સતત ચાલુ છે અને નવા નવા આયામ ઉમેરાતા જાય છે.
પરંતુ મશીન લર્નીગના દુષપરિણામ પણ માણસના જીવનને ઉદ્ધવત કરી શકે છે તેનું જ્વલંત ઉદાહરણ Deep Fake નો વિકસિત થઈ ચૂક્યો છે. જી હા, આપ જો તે વિશે વાંચશો તો માલુમ પડશે કે કોઈ પણ વ્યક્તિના અનેક ફોટોગ્રાફ એકત્ર કરી સોફ્ટવેર ની મદદ થી વિડીયો બનાવી શકો છો જેમાં એ વ્યક્તિના અવાજને ડબીગ કરી Text to Speech ની મદદ થી આપની ઈચ્છા મુજબ બોલાવી શકો છો કે જે તે વ્યક્તિ કદી બોલી જ ન હોય. અને તેમ કરીને ખાસ કરીને જાહેર જીવન માં મોટી વ્યક્તિ ને આ Deep fake નો ઉપયોગ કરી બદનામ કરી શકો છો.
ખેર fake Video ને ઓળખવા પણ software બની રહ્યા છે.
ઈશ્વરને પ્રાર્થના કે માનવી વિકસિત Technology નો સદુપયોગ કરે.
આપનો નિરંજન કોર્ડ
Deep fake video link is given below. One can understand how it can bring dangerous results.
https://youtu.be/gLoI9hAX9dw