विधि बनाता है स्वचालित रूप से अनुरोध और अधिक विनम्र — ScienceDaily


पिट्सबर्ग में एक तनावपूर्ण समय है जब एक महामारी rages, राजनेताओं लड़ाई के लिए वोट और प्रदर्शनकारियों की मांग नस्लीय न्याय, एक छोटे से विनम्रता और शिष्टाचार एक लंबा रास्ता जा. अब शोधकर्ताओं ने कार्नेगी मेलॉन विश्वविद्यालय में विकसित किया है एक स्वचालित विधि बनाने के लिए संचार और अधिक विनम्र.

विशेष रूप से, विधि लेता है nonpolite निर्देशों या अनुरोध-उन का उपयोग करें कि या तो असभ्य या तटस्थ भाषा है-और restructures उन्हें या कहते हैं, शब्द बनाने के लिए उन्हें और अधिक अच्छी तरह से व्यवहार है. “मुझे डेटा भेजे,” उदाहरण के लिए, हो सकता है “तुम सकता है कृपया मुझे भेजने के डेटा?”

शोधकर्ताओं ने पेश करेंगे उनके अध्ययन पर विनम्रता हस्तांतरण पर एसोसिएशन के लिए कम्प्यूटेशनल भाषा विज्ञान वार्षिक बैठक है, जो आयोजित किया जाएगा वस्तुतः शुरुआत 5 जुलाई.

विचार के हस्तांतरण की एक शैली या भावना से एक संचार के लिए एक और — मोड़ नकारात्मक बयान सकारात्मक, उदाहरण के लिए-कुछ भाषा प्रौद्योगिकीविदों कर दिया गया है कुछ समय के लिए. Shrimai Prabhumoye, एक पीएच. डी छात्र में सीएमयू के भाषा प्रौद्योगिकी संस्थान (LTI), ने कहा कि प्रदर्शन कर रहा शील हस्तांतरण लंबे समय से एक लक्ष्य दिया गया है.

“यह अत्यंत प्रासंगिक कुछ अनुप्रयोगों के लिए, इस तरह के रूप में आप चाहते हैं बनाने के लिए अपने ईमेल या chatbot ध्वनि और अधिक विनम्र या यदि आप एक ब्लॉग लिखने के लिए,” उसने कहा. “लेकिन हम कभी नहीं मिल सकता सही डेटा प्रदर्शन करने के लिए इस काम है.”

वह और LTI के मास्टर छात्रों अमन Madaan, Amrith Setlur और तन्मय पारेख हल है कि समस्या पैदा करने के द्वारा एक डाटासेट के 1.39 लाख वाक्य लेबल के लिए विनम्रता, जो वे के लिए इस्तेमाल किया उनके प्रयोगों.

स्रोत के इन वाक्यों लग सकता है आश्चर्य की बात है । वे से प्राप्त किए गए ईमेल का आदान-प्रदान के कर्मचारियों द्वारा एनरॉन, एक टेक्सास आधारित ऊर्जा कंपनी है कि, जब तक इसकी निधन 2001 में किया गया था, बेहतर जाना जाता है के लिए कॉर्पोरेट धोखाधड़ी और भ्रष्टाचार के लिए की तुलना में सामाजिक तफ़सील. लेकिन आधे से एक लाख कॉर्पोरेट ईमेल सार्वजनिक बन गया एक परिणाम के रूप में मुकदमों के आसपास एनरॉन की धोखाधड़ी घोटाले और बाद में इस्तेमाल किया गया है के रूप में एक डेटासेट की एक किस्म के लिए अनुसंधान परियोजनाओं.

लेकिन यहां तक कि के साथ एक डाटासेट, शोधकर्ताओं ने चुनौती दी थी बस को परिभाषित करने के लिए विनम्रता.

“यह है नहीं बस के बारे में शब्दों का उपयोग के रूप में इस तरह ‘कृपया’ और ‘धन्यवाद'” Prabhumoye कहा. कभी कभी, इसका मतलब यह भाषा बनाने के एक थोड़ा कम सीधा है, इसलिए है कि के बजाय कह “आप क्या करना चाहिए एक्स,” वाक्य बन जाता है, कुछ की तरह “हमें क्या एक्स”

और विनम्रता से भिन्न होता है एक संस्कृति के लिए. यह आम है के लिए देशी उत्तरी अमेरिकियों का उपयोग करने के लिए “कृपया” के लिए अनुरोध में करीबी दोस्तों, लेकिन अरब संस्कृति में यह माना जाएगा अजीब यदि नहीं, तो अशिष्ट । उनके अध्ययन के लिए, सीएमयू के शोधकर्ताओं ने प्रतिबंधित करने के लिए अपने काम के वक्ताओं उत्तर अमेरिकी अंग्रेजी में एक औपचारिक सेटिंग.

आदाब डेटासेट का विश्लेषण किया गया था निर्धारित करने के लिए आवृत्ति और वितरण के शब्दों में विनम्र और nonpolite वाक्य. तब टीम विकसित एक “टैग और” उत्पन्न करने के लिए पाइप लाइन प्रदर्शन शील स्थानान्तरण. सबसे पहले, असभ्य या nonpolite शब्दों या वाक्यांशों रहे हैं टैग की गईं और फिर एक पाठ जनरेटर की जगह प्रत्येक चिह्नित आइटम. सिस्टम की देखभाल को बदलने के लिए नहीं के अर्थ के साथ वाक्य.

“यह न सिर्फ सफाई के बारे में शब्दों कसम खाता हूँ,” Prabhumoye कहा की प्रक्रिया है । प्रारंभ में, प्रणाली के लिए एक प्रवृत्ति थी बस जोड़ने के लिए शब्द, वाक्य, उच्चारण, जैसे “कृपया” या “क्षमा करें.” अगर “कृपया मेरी मदद करो” माना जाता था, विनम्र, सिस्टम माना जाता है “कृपया, कृपया, कृपया मेरी मदद करो” और भी अधिक विनम्र.

लेकिन समय के साथ स्कोरिंग प्रणाली बन गया है, और अधिक यथार्थवादी और परिवर्तन हो गया subtler. पहले व्यक्ति एकवचन सर्वनाम, इस तरह के रूप में मैं, मुझे और मेरा, द्वारा बदल दिया गया था पहले व्यक्ति बहुवचन सर्वनाम, इस तरह के रूप में हम, हमें और हमारे. और के बजाय स्थिति “कृपया” पर एक वाक्य की शुरुआत में, प्रणाली सीखा सम्मिलित करने के लिए, यह के भीतर वाक्य: “आप कृपया मुझे भेज फ़ाइल?”

Prabhumoye ने कहा कि शोधकर्ताओं ने जारी किया है उनके लेबल के लिए डाटासेट का उपयोग अन्य शोधकर्ताओं द्वारा की उम्मीद है, करने के लिए उन्हें प्रोत्साहित करने के लिए आगे के अध्ययन विनम्रता.

###

इसके अलावा छात्रों के लिए, अध्ययन के सह-लेखकों में शामिल कई प्रोफेसरों से LTI और मशीन लर्निंग विभाग — बरनबास Poczos, ग्राहम Neubig, Yiming यांग, रुस्लान Salakhutdinov और एलन काला । वायु सेना अनुसंधान प्रयोगशाला, कार्यालय के नौसेना अनुसंधान, राष्ट्रीय विज्ञान फाउंडेशन, एप्पल और NVIDIA समर्थित इस अनुसंधान.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *