प्रतिकूल मशीन लर्निंग: अर्थ, उदाहरण और यह कैसे काम करता है
एडवरसैरियल मशीन लर्निंग मशीन लर्निंग की एक शाखा है जो विभिन्न हमलों के लिए मशीन लर्निंग मॉडल की कमजोरियों पर ध्यान केंद्रित करती है।
प्रतिकूल इनपुट कोई भी मशीन लर्निंग इनपुट है जिसका उद्देश्य मॉडल को गलत भविष्यवाणियां करने या गलत आउटपुट देने के लिए मूर्ख बनाना है।
क्योंकि प्रतिकूल हमलों के गंभीर परिणाम हो सकते हैं, जिनमें शामिल हैं सुरक्षा, धोखाधड़ी और स्वास्थ्य सेवा क्षेत्रों में, शोधकर्ता विभिन्न हमले के तरीकों की खोज करने के साथ-साथ उनके खिलाफ रक्षा तंत्र विकसित करने पर ध्यान केंद्रित करते हैं।
यह पोस्ट प्रतिकूल मशीन सीखने की दुनिया की पड़ताल करती है और इसमें उदाहरण, चुनौतियाँ और हमला करने और बचाव करने के तरीके शामिल हैं AI मॉडल ।
एडवरसैरियल मशीन लर्निंग क्या है?
एडवरसैरियल मशीन लर्निंग हमलों के एक वर्ग का अध्ययन करता है जिसका उद्देश्य विशिष्ट कार्यों पर क्लासिफायर के प्रदर्शन को कम करना है। दूसरे शब्दों में, उनका लक्ष्य एआई मशीन को मूर्ख बनाना है।
जैसे-जैसे कृत्रिम बुद्धिमत्ता और मशीन लर्निंग तकनीकों का उपयोग व्यापक होता जा रहा है, प्रतिकूल हमलों का खतरा बढ़ता जा रहा है। यह विभिन्न एआई-संचालित अनुप्रयोगों के लिए एक महत्वपूर्ण खतरा प्रस्तुत करता है, जिसमें स्पैम का पता लगाना, व्यक्तिगत सहायक, कंप्यूटर विज़न आदि शामिल हैं।
प्रतिकूल हमले कैसे काम करते हैं
एक प्रतिकूल हमला मशीन लर्निंग मॉडल को गलत अनुमान लगाने के लिए मूर्ख बनाने के लिए डिज़ाइन की गई कोई भी प्रक्रिया है। यह प्रशिक्षण के दौरान, साथ ही लाइव निष्पादन वातावरण में भी हो सकता है। दूसरे शब्दों में, यदि आप मॉडल को मूर्ख बनाने या तोड़फोड़ करने का कोई तरीका ढूंढ सकते हैं, तो आपने उस पर सफलतापूर्वक हमला कर दिया है।
एक प्रतिकूल उदाहरण क्या है?
एक प्रतिकूल उदाहरण मशीन लर्निंग मॉडल के लिए कोई विशेष रूप से डिज़ाइन किया गया इनपुट है जिसका उद्देश्य मॉडल से गलती कराना या गलत आउटपुट उत्पन्न करना है।
आप इनपुट डेटा में थोड़ा बदलाव करके एक प्रतिकूल उदाहरण बना सकते हैं, जो हालांकि मानव आंखों को दिखाई नहीं दे सकता है, लेकिन अक्सर मॉडल की समझ को बदलने और गलत आउटपुट देने के लिए पर्याप्त होता है।
एआई मॉडल के प्रशिक्षण चरणों में प्रतिकूल उदाहरणों का उपयोग किया जाता है और किए गए संशोधन आम तौर पर विभिन्न अनुकूलन तकनीकों का उपयोग करके उत्पन्न होते हैं, जिसमें फास्ट ग्रेडिएंट साइन मेथड (एफजीएसएम) अटैक जैसे ग्रेडिएंट-आधारित तरीके शामिल हैं, जो बदलावों के लिए मॉडल की संवेदनशीलता का फायदा उठाते हैं। इनपुट स्थान.
प्रतिकूल उदाहरणों के साथ लक्ष्य इनपुट डेटा में थोड़ी गड़बड़ी जोड़ना है जो मानव पर्यवेक्षकों को मुश्किल से दिखाई दे सकता है, लेकिन फिर भी मॉडल को इनपुट को गलत वर्गीकृत करने के लिए प्रेरित करने के लिए पर्याप्त महत्वपूर्ण है।
छवि पहचान और प्राकृतिक भाषा प्रसंस्करण सहित विभिन्न मशीन सीखने के क्षेत्रों में प्रतिकूल हमले हो सकते हैं।
एडवरसैरियल एमएल के अनुप्रयोग
किसी भी कृत्रिम बुद्धिमत्ता प्लेटफ़ॉर्म में कमजोरियों का पता लगाने और उनका फायदा उठाने की क्षमता के उपयोग की एक विस्तृत श्रृंखला है, क्योंकि हमलावर केवल अपनी कल्पना तक ही सीमित है। यहाँ कई तरीकों में से कुछ हैं जो a हैकर प्रतिकूल मशीन सीखने के तरीकों का उपयोग करके एक समझौता की गई एआई मशीन का लाभ उठा सकते हैं।
- छवि एवं वीडियो पहचान: सामग्री मॉडरेशन से लेकर स्वायत्त वाहनों और निगरानी प्रणालियों तक, बहुत सारे कृत्रिम बुद्धिमत्ता अनुप्रयोग छवि और वीडियो पहचान एल्गोरिदम पर निर्भर करते हैं। मशीन के इनपुट को बदलकर और उसे सामान को गलत वर्गीकृत करने के लिए मजबूर करके, एक हमलावर किसी भी नियंत्रण प्रणाली से बच सकता है जो उसकी ऑब्जेक्ट पहचान क्षमताओं पर निर्भर करती है। स्वायत्त वाहनों के लिए, इस तरह के हेरफेर से सड़क दुर्घटनाएं हो सकती हैं।
- स्पैम फ़िल्टरिंग: स्पैमर्स विभिन्न संरचनाओं, अधिक अच्छे शब्दों, कम बुरे शब्दों आदि के साथ अपने स्पैम ईमेल को अनुकूलित करके एआई स्पैम डिटेक्शन सिस्टम को सफलतापूर्वक बायपास कर सकते हैं।
- मालवेयर डिटेक्शन: दुर्भावनापूर्ण कंप्यूटर कोड तैयार करना भी उतना ही संभव है जो मैलवेयर स्कैनर द्वारा पता लगाने से बच सकता है।
- प्राकृतिक भाषा संसाधन: प्रतिकूल मशीन लर्निंग का उपयोग करके पाठ को गलत वर्गीकृत करके, हमलावर पाठ-आधारित अनुशंसा प्रणाली, नकली समाचार डिटेक्टर, भावना डिटेक्टर आदि में हेरफेर कर सकता है।
- हेल्थकेयर: हमलावर या तो मरीज के निदान को बदलने के लिए मेडिकल रिकॉर्ड में हेरफेर कर सकते हैं या संवेदनशील मेडिकल रिकॉर्ड का खुलासा करने के लिए सिस्टम को धोखा दे सकते हैं।
- वित्तीय धोखाधड़ी का पता लगाना: वित्तीय धोखाधड़ी का पता लगाने में नियोजित एआई सिस्टम को प्रतिकूल मशीन लर्निंग हमलों से भी खतरा है। उदाहरण के लिए, एक हमलावर सिंथेटिक डेटा बना सकता है जो वैध लेनदेन की नकल करता है, जिससे मॉडल द्वारा पहचाने बिना धोखाधड़ी करना संभव हो जाता है।
- बॉयोमीट्रिक सुरक्षा प्रणाली: हेरफेर किए गए डेटा को नियोजित करके, एक हमलावर किसी नेटवर्क या प्लेटफ़ॉर्म पर अनधिकृत पहुंच प्राप्त करने के लिए फिंगरप्रिंट या चेहरे की पहचान सुरक्षा प्रणालियों को हरा सकता है।
- प्रतिकूल रक्षा: जबकि उपरोक्त अधिकांश उपयोग किसी सिस्टम पर हमला करने के लिए हैं, प्रतिकूल रक्षा मशीन के हमलावरों के खिलाफ मजबूत रक्षा प्रणाली बनाने में उपयोग के लिए प्रतिकूल हमलों का अध्ययन है।
प्रतिकूल एमएल के परिणाम
प्रतिकूल मशीन लर्निंग के ऐसे परिणाम होते हैं जो एआई सिस्टम की विश्वसनीयता या प्रदर्शन को प्रभावित कर सकते हैं। यहाँ प्रमुख हैं.
- इरोड्स ट्रस्ट: यदि प्रतिकूल हमले बढ़ते हैं और नियंत्रण से बाहर हो जाते हैं, तो इससे एआई सिस्टम के लिए विश्वास कम हो जाएगा, क्योंकि जनता किसी भी मशीन-लर्निंग आधारित सिस्टम को संदेह की दृष्टि से देखने लगेगी।
- नैतिक निहितार्थ: स्वास्थ्य देखभाल और आपराधिक न्याय जैसे डोमेन में मशीन लर्निंग सिस्टम का अनुप्रयोग नैतिक प्रश्न उठाता है, क्योंकि कोई भी समझौता किया गया एआई सिस्टम गंभीर व्यक्तिगत और सामाजिक क्षति का कारण बन सकता है।
- आर्थिक प्रभाव: प्रतिकूल हमलों से वित्तीय हानि, सुरक्षा लागत में वृद्धि, वित्तीय बाजार में हेराफेरी और यहां तक कि प्रतिष्ठा को नुकसान हो सकता है।
- बढ़ी हुई जटिलता: प्रतिकूल हमलों का खतरा अनुसंधान प्रयास और मशीन लर्निंग सिस्टम की समग्र जटिलता को बढ़ाता है।
- मॉडल चोरी: एक एआई मॉडल पर आंतरिक मापदंडों या उसके आर्किटेक्चर के बारे में जानकारी की जांच करने और उसे पुनः प्राप्त करने के लिए हमला किया जा सकता है जिसे सिस्टम पर अधिक गंभीर हमले के लिए नियोजित किया जा सकता है।
प्रतिकूल हमलों के प्रकार
विभिन्न प्रकार के प्रतिकूल मशीन लर्निंग हमले हैं, और वे हमलावर के लक्ष्यों और सिस्टम तक उसकी कितनी पहुंच है, इसके आधार पर भिन्न होते हैं। यहाँ प्रमुख प्रकार हैं.
- चोरी के हमले: चोरी के हमलों में, विरोधी एआई प्रणाली को गलत वर्गीकृत करने के लिए इनपुट को संशोधित करते हैं। इसमें मॉडल को धोखा देने के लिए इनपुट छवियों या अन्य डेटा में अगोचर गड़बड़ी (या जानबूझकर शोर) जोड़ना शामिल हो सकता है।
- डेटा विषाक्तता हमले: एआई सिस्टम के प्रशिक्षण चरण के दौरान डेटा पॉइज़निंग हमले होते हैं। मशीन के प्रशिक्षण डेटासेट में खराब (या जहरीला) डेटा जोड़ने से, मॉडल अपनी भविष्यवाणियों में कम सटीक हो जाता है और इसलिए, समझौता हो जाता है।
- मॉडल निष्कर्षण हमले: मॉडल व्युत्क्रम हमलों में, विरोधी प्रशिक्षित एआई मॉडल से संवेदनशील जानकारी निकालने की क्षमता का फायदा उठाते हैं। इनपुट में हेरफेर करके और मॉडल की प्रतिक्रियाओं को देखकर, वे छवियों या पाठ जैसे निजी डेटा का पुनर्निर्माण कर सकते हैं।
- स्थानांतरण आक्रमण: यह एक मशीन लर्निंग सिस्टम के खिलाफ हमले की दूसरे मशीन लर्निंग सिस्टम के खिलाफ समान रूप से प्रभावी होने की क्षमता को संदर्भित करता है।
प्रतिकूल हमलों से बचाव कैसे करें
विभिन्न रक्षा तंत्र हैं जिनका उपयोग आप अपने एआई मॉडल को प्रतिकूल हमलों से बचाने के लिए कर सकते हैं। यहां कुछ सर्वाधिक लोकप्रिय हैं।
- मजबूत सिस्टम बनाना: इसमें एआई मॉडल का विकास शामिल है जो परीक्षण और मूल्यांकन दिशानिर्देशों को शामिल करके प्रतिकूल हमलों के प्रति अधिक प्रतिरोधी है ताकि डेवलपर्स को सिस्टम की खामियों की पहचान करने में मदद मिल सके जो प्रतिकूल हमलों का कारण बन सकती हैं। फिर वे ऐसे हमलों के खिलाफ सुरक्षा विकसित कर सकते हैं।
- इनपुट सत्यापन: दूसरा तरीका पहले से ज्ञात कमजोरियों के लिए एमएल मॉडल में इनपुट की जांच करना है। मॉडल को इनपुट को अस्वीकार करने के लिए डिज़ाइन किया जा सकता है, उदाहरण के लिए, जिसमें ऐसे संशोधन शामिल हैं जो मशीनों को गलत भविष्यवाणियां करने के लिए जाना जाता है।
- प्रतिकूल प्रशिक्षण: आप अपने सिस्टम के प्रशिक्षण डेटा में कुछ मात्रा में प्रतिकूल उदाहरण भी शामिल कर सकते हैं ताकि मॉडल को भविष्य में प्रतिकूल उदाहरणों का पता लगाना और उन्हें अस्वीकार करना सीखने में मदद मिल सके।
- व्याख्या करने योग्य ए.आई.: सैद्धांतिक रूप से, बेहतर डेवलपर्स और उपयोगकर्ता समझते हैं कि एआई मॉडल गहराई से कैसे काम करता है, लोगों के लिए हमलों के खिलाफ बचाव करना उतना ही आसान होगा। इसलिए, मशीन लर्निंग और एआई मॉडल विकास के लिए एक समझाने योग्य एआई (एक्सएआई) दृष्टिकोण कई समस्याओं का समाधान कर सकता है।
निष्कर्ष
प्रतिकूल मशीन लर्निंग हमले कृत्रिम बुद्धिमत्ता प्रणालियों की विश्वसनीयता और प्रदर्शन के लिए एक महत्वपूर्ण खतरा पैदा करते हैं। हालाँकि, विभिन्न प्रकार के प्रसिद्ध हमलों को समझकर और उन्हें रोकने के लिए रक्षा रणनीतियों को लागू करके, डेवलपर्स अपने एआई मॉडल को प्रतिकूल हमलों से बेहतर ढंग से सुरक्षित कर सकते हैं।
अंत में, आपको यह समझना चाहिए कि एआई और प्रतिकूल मशीन लर्निंग के क्षेत्र अभी भी बढ़ रहे हैं। तो, वहाँ अभी भी अन्य प्रतिकूल हमले के तरीके हो सकते हैं जो अभी तक सार्वजनिक ज्ञान नहीं बन पाए हैं।
संसाधन
- https://en.wikipedia.org/wiki/Adversarial_machine_learning
- https://www.csoonline.com/article/573031/adversarial-machine-learning-explained-how-attackers-disrupt-ai-and-ml-systems.html
- https://medium.com/@durgeshpatel2372001/an-introduction-to-adversarial-machine-learning-820010645df9
- https://insights.sei.cmu.edu/blog/the-challenge-of-adversarial-machine-learning/
- https://viso.ai/deep-learning/adversarial-machine-learning/
- https://www.toptal.com/machine-learning/adversarial-machine-learning-tutorial