प्रत्यक्ष साहित्यिक चोरी सबसे सरल और जानबूझकर की गई साहित्यिक चोरी है - किसी और के पाठ को शब्दशः कॉपी करना और बिना उद्धरण चिह्नों या संदर्भ दिए उसे अपना बताकर प्रस्तुत करना। इसमें पुस्तकों, लेखों, वेबसाइटों या अन्य छात्रों के शोध पत्रों से पूरे अनुच्छेदों की नकल करना शामिल है। शैक्षणिक परिवेश में, प्रत्यक्ष साहित्यिक चोरी को बेईमानी का एक गंभीर अपराध माना जाता है और आमतौर पर इसके लिए कठोरतम दंड दिए जाते हैं, जिनमें पाठ्यक्रम में अनुत्तीर्ण होना या निष्कासन शामिल है।
प्रत्यक्ष साहित्यिक चोरी का पता लगाना सबसे आसान है। टेक्स्ट-मैचिंग एल्गोरिदम अरबों इंडेक्स किए गए वेब पेजों, अकादमिक डेटाबेस और प्रकाशित रचनाओं के साथ प्रस्तुत दस्तावेजों की तुलना करते हैं। जब प्रस्तुत रचना और किसी मौजूदा स्रोत दोनों में टेक्स्ट की एक जैसी पंक्तियाँ दिखाई देती हैं, तो मिलान तुरंत चिह्नित हो जाता है। यहां तक कि कॉपी किए गए टेक्स्ट को छिपाने के प्रयास - जैसे कि लैटिन अक्षरों के समान दिखने वाले यूनिकोड वर्णों का उपयोग करना - भी Unicode Anti-Cheating Engine (UACE) जैसे विशेष उपकरणों द्वारा पकड़े जा सकते हैं।
स्व-साहित्यिक चोरी, जिसे पुनर्चक्रण या दोहरा प्रकाशन भी कहा जाता है, तब होती है जब कोई लेखक बिना बताए अपने पहले से प्रस्तुत या प्रकाशित कार्य का पुनः उपयोग करता है। इसमें एक ही शोधपत्र को कई पाठ्यक्रमों में प्रस्तुत करना, किसी पिछले लेख के कुछ अंशों को किसी नए प्रकाशन में पुनः प्रकाशित करना, या किसी शोध प्रबंध के महत्वपूर्ण हिस्सों को किसी पत्रिका में प्रस्तुत करना शामिल है। हालांकि यह हानिरहित लग सकता है - आखिरकार, आपने ही मूल रचना लिखी है - स्व-साहित्यिक चोरी इस अपेक्षा का उल्लंघन करती है कि प्रत्येक प्रस्तुति मौलिक कार्य हो।
अकादमिक जगत में, स्व-साहित्यिक चोरी विशेष रूप से समस्याग्रस्त है क्योंकि असाइनमेंट नए ज्ञान और मौलिक सोच को प्रदर्शित करने के लिए तैयार किए जाते हैं। प्रकाशन में, यह अकादमिक रिकॉर्ड को विकृत करता है और पहले से प्रकाशित कार्यों के अधिकार रखने वाले प्रकाशकों के साथ कॉपीराइट समझौतों का उल्लंघन कर सकता है। कई पत्रिकाएँ अब सहकर्मी समीक्षा के दौरान स्व-साहित्यिक चोरी की स्पष्ट रूप से जाँच करती हैं। PDAS (साहित्यिक चोरी डिटेक्टर Accumulator Server) जैसे संस्थागत दस्तावेज़ डेटाबेस संगठनों को पहले प्रस्तुत किए गए कार्यों का संग्रह बनाए रखने में मदद करते हैं, जिससे सेमेस्टर और विभागों में स्व-साहित्यिक चोरी का पता लगाना व्यावहारिक हो जाता है।
मोज़ेक साहित्यिक चोरी, जिसे पैचवर्क साहित्यिक चोरी भी कहा जाता है, सबसे भ्रामक रूपों में से एक है। इसमें अनेक स्रोतों से वाक्यांश, वाक्य या विचार लेकर उन्हें आपस में जोड़ दिया जाता है - अक्सर शब्दों में मामूली बदलाव करके - ताकि एक मौलिक रचना प्रतीत हो। साहित्यिक चोर यहाँ एक शब्द बदल सकता है या वहाँ एक वाक्य को पुनर्गठित कर सकता है, लेकिन विचार, संरचना और अक्सर वाक्यांश भी बिना उचित संदर्भ दिए उधार लिए गए ही रहते हैं।
प्रत्यक्ष साहित्यिक चोरी की तुलना में इस प्रकार की साहित्यिक चोरी का पता लगाना अधिक कठिन है क्योंकि इसमें कोई भी अंश मूल स्रोत से हूबहू मेल नहीं खाता। इसके बजाय, पाठ विभिन्न स्रोतों से लिए गए आंशिक रूप से संशोधित अंशों का एक मिलाजुला रूप होता है। मोज़ेक साहित्यिक चोरी का पता लगाने के लिए परिष्कृत एल्गोरिदम की आवश्यकता होती है जो एक साथ कई स्रोतों में आंशिक मिलान और समानता के पैटर्न की पहचान कर सकें। प्रभावी पहचान उपकरण 4 अरब से अधिक इंटरनेट स्रोतों में खोज करते हैं और प्रत्येक उधार लिए गए अंश को खोजने की संभावना को अधिकतम करने के लिए कई खोज इंजनों का उपयोग करते हैं, चाहे उसे कितनी भी चतुराई से एकीकृत किया गया हो।
अनजाने में साहित्यिक चोरी तब होती है जब कोई लेखक स्रोतों का सही उल्लेख करने में विफल रहता है, जानकारी को गलत तरीके से प्रस्तुत करता है, या अनजाने में मूल वाक्य से मिलते-जुलते शब्दों का प्रयोग करता है। ऐसा अक्सर तब होता है जब छात्र शोध के दौरान ठीक से नोट्स नहीं बनाते हैं - वे यह चिह्नित नहीं करते कि कौन से शब्द सीधे उद्धरण हैं और कौन से उनके अपने सारांश हैं - या जब वे अपने विषय में आवश्यक उद्धरण नियमों से परिचित नहीं होते हैं।
अनजाने में हुई साहित्यिक चोरी को भी अधिकांश संस्थान साहित्यिक चोरी ही मानते हैं। इरादे से किया गया काम स्रोतों का उल्लेख न करने का बहाना नहीं हो सकता। अनजाने में हुई साहित्यिक चोरी से बचने का सबसे अच्छा तरीका है सावधानीपूर्वक नोट्स बनाना, उद्धरण मानकों की पूरी जानकारी रखना और जमा करने से पहले अंतिम बार साहित्यिक चोरी की जाँच करना। जमा करने से पहले अपने काम की जाँच करने से आप अनदेखे उद्धरणों या मूल स्रोत से बहुत मिलते-जुलते अंशों को पकड़ सकते हैं, जिससे आपको उन्हें सुधारने का मौका मिलता है।
पैराफ्रेज़िंग साहित्यिक चोरी तब होती है जब कोई व्यक्ति किसी दूसरे व्यक्ति के विचारों को अलग शब्दों में लिखता है लेकिन स्रोत का उचित उल्लेख नहीं करता। प्रत्यक्ष साहित्यिक चोरी के विपरीत, इसमें शब्दों को बदला जाता है - कभी-कभी काफी हद तक - लेकिन मूल विचार, तर्क या संरचना स्रोत से बिना श्रेय दिए ले ली जाती है। कई छात्र गलती से मानते हैं कि शब्दों को बदलना ही काफी है, लेकिन उचित शैक्षणिक प्रक्रिया के अनुसार, विचार को चाहे जिस रूप में व्यक्त किया गया हो, स्रोत का उल्लेख करना आवश्यक है।
पैराफ़्रेज़िंग द्वारा साहित्यिक चोरी का पता लगाना साहित्यिक चोरी का पता लगाने के सबसे चुनौतीपूर्ण कार्यों में से एक है, क्योंकि पाठ मूल पाठ से शब्द-दर-शब्द मेल नहीं खाता। केवल मानक पाठ मिलान ही पर्याप्त नहीं है। उन्नत पुनर्लेखन पहचान तकनीक शब्दों के अर्थ और संरचना का विश्लेषण करके ऐसी सामग्री की पहचान करती है जिसे बिना संदर्भ दिए पैराफ़्रेज़ किया गया है। यह क्षमता किसी भी गंभीर साहित्यिक चोरी का पता लगाने की कार्यप्रणाली के लिए आवश्यक है, क्योंकि पैराफ़्रेज़िंग अकादमिक और व्यावसायिक लेखन में पाई जाने वाली साहित्यिक चोरी के सबसे सामान्य रूपों में से एक है।
कृत्रिम बुद्धिमत्ता (AI) द्वारा उत्पन्न साहित्यिक चोरी सबसे नया और तेजी से बढ़ता हुआ रूप है। इसमें चैटजीपीटी, जेमिनी या हगिंगचैट जैसे बड़े भाषा मॉडलों द्वारा निर्मित सामग्री को अपने स्वयं के मौलिक कार्य के रूप में प्रस्तुत करना शामिल है। चूंकि AI द्वारा उत्पन्न पाठ किसी एक स्रोत से कॉपी नहीं किया जाता है, इसलिए यह पारंपरिक पाठ मिलान प्रणाली से पूरी तरह बच निकलता है। आउटपुट सांख्यिकीय रूप से अद्वितीय होता है, फिर भी यह प्रस्तुतकर्ता के स्वयं के चिंतन, शोध या ज्ञान का परिणाम नहीं होता है।
कृत्रिम बुद्धिमत्ता (AI) द्वारा निर्मित सामग्री का पता लगाने के लिए एक मौलिक रूप से भिन्न दृष्टिकोण की आवश्यकता होती है। AI पहचान एल्गोरिदम पाठ के सांख्यिकीय पैटर्न - जैसे कि टोकन की पूर्वानुमानशीलता, perplexity और परिवर्तनशीलता (burstiness) - का विश्लेषण करके यह निर्धारित करते हैं कि सामग्री किसी मानव के बजाय मशीन द्वारा निर्मित होने की संभावना है या नहीं। साहित्यिक चोरी डिटेक्टर में 0.98 की संवेदनशीलता के साथ AI सामग्री पहचान शामिल है, जो ChatGPT, Gemini, HuggingChat और अन्य भाषा मॉडलों से आउटपुट की पहचान करने में सक्षम है। एक ही स्कैन में पारंपरिक साहित्यिक चोरी पहचान और AI सामग्री विश्लेषण का संयोजन उपलब्ध सबसे व्यापक मौलिकता मूल्यांकन प्रदान करता है।
साहित्यिक चोरी और एआई-जनित सामग्री की जांच शुरू करने के लिए एक निःशुल्क डेमो डाउनलोड करें या लाइसेंस खरीदें।
अलग-अलग प्रकार की साहित्यिक चोरी का पता लगाने के लिए अलग-अलग रणनीतियों की आवश्यकता होती है। प्रत्यक्ष साहित्यिक चोरी का पता प्रकाशित सामग्री के विशाल डेटाबेस के साथ सटीक मिलान वाले पाठ की तुलना करके लगाया जाता है। मोज़ेक साहित्यिक चोरी के लिए आंशिक मिलान वाले एल्गोरिदम की आवश्यकता होती है जो उधार लिए गए अंशों को भी पहचान सकें, भले ही वे मूल पाठ में अंतर्निहित हों। पैराफ़्रेज़िंग साहित्यिक चोरी के लिए पुनर्लेखन का पता लगाने वाली ऐसी तकनीक की आवश्यकता होती है जो सतही शब्दों के बजाय अर्थ का विश्लेषण करे। कृत्रिम बुद्धिमत्ता (AI) द्वारा उत्पन्न साहित्यिक चोरी के लिए सांख्यिकीय पाठ विश्लेषण की आवश्यकता होती है जो मशीन द्वारा उत्पन्न आउटपुट की विशिष्ट विशेषताओं का मूल्यांकन करे।
एक व्यापक साहित्यिक चोरी का पता लगाने वाला टूल एक ही कार्यप्रणाली में इन सभी प्रकारों को संबोधित करता है। प्लेगरिज्म डिटेक्टर Google, Bing, Yahoo और DuckDuckGo का उपयोग करके एक साथ 4 अरब से अधिक इंटरनेट स्रोतों में खोज करता है, पुनर्लेखन का पता लगाने और UACE धोखाधड़ी-विरोधी तकनीक को जोड़ता है, और AI सामग्री का पता लगाने को एकीकृत करता है - यह सब एक डेस्कटॉप एप्लिकेशन में है जो आपके दस्तावेज़ों को गोपनीय रखता है। 12 से अधिक फ़ाइल स्वरूपों (DOC, DOCX, PDF, RTF, PPT, PPTX, TXT, ODT, HTML, और अन्य) का समर्थन करता है और फ़ोल्डर वॉच के माध्यम से बैच प्रोसेसिंग की सुविधा देता है, जिससे दस्तावेज़ के प्रकार या मात्रा की परवाह किए बिना पूरी तरह से कवरेज मिलता है।