विश्लेषण के 100 अरब ट्वीट में नए अंतर्दृष्टि प्रदान भाषाई पैटर्न — ScienceDaily


एक जांच के ट्विटर संदेश से पता चलता है नए अंतर्दृष्टि और उपकरण के अध्ययन के लिए कैसे लोगों को इस्तेमाल बढ़ाकर शब्दों में, इस तरह के रूप में “duuuuude,” “heyyyyy,” या “noooooooo.” टायलर ग्रे और उनके सहयोगियों के विश्वविद्यालय में वरमोंट बर्लिंगटन में मौजूद इन निष्कर्षों में खुले उपयोग पत्रिका एक PLOS 27 मई, 2020.

में बात की और लिखित भाषा, फैला शब्दों को संशोधित कर सकते हैं एक शब्द के अर्थ. उदाहरण के लिए, “suuuuure” कर सकते हैं मतलब व्यंग्य, “yeeessss” का संकेत हो सकता है उत्तेजना. फैला शब्दों में दुर्लभ हैं औपचारिक लेखन, लेकिन सामाजिक मीडिया के उदय के लिए खोला गया है, नए अवसरों का अध्ययन करने के लिए उन्हें.

ग्रे और उनके सहयोगियों ने किया है, अब पूरा सबसे व्यापक अध्ययन की तारीख करने के लिए “stretchable” शब्दों में सामाजिक मीडिया. वे विकसित की एक नई, और अधिक पूरी तरह से रणनीति की पहचान करने के लिए बढ़ाया शब्दों में ट्वीट और यह प्रयोग किया जाता का विश्लेषण करने के लिए एक बेतरतीब ढंग से चयनित डेटासेट के बारे में 10 प्रतिशत के ट्वीट उत्पन्न के बीच सितंबर 2008 और दिसंबर 2016 — के बारे में कुल 100 अरब डॉलर का ट्वीट.

शोधकर्ताओं के हजारों लोगों की पहचान “stretchable” शब्दों में ट्वीट सहित, “हा” (उदा., “hahaha” या “haaahaha”), “भयानक” (उदा., “awesssssommmmmeeeeee”) और “लक्ष्य) (उदाहरण के लिए, ggggoooooaaaaallllll).

वे यह भी पहचान के दो प्रमुख तरीके को मापने के लक्षण स्केलेबल शब्द: संतुलन और खिंचाव. संतुलन के लिए संदर्भित करता है जो करने के लिए डिग्री अलग अलग अक्षरों करते हैं करने के लिए दोहराया जा सकता है । उदाहरण के लिए, “हा” के एक उच्च डिग्री है संतुलन, क्योंकि जब यह फैला है, “एच” और “एक” करते हैं दोहराया जा करने के लिए बस के बारे में समान रूप से. “लक्ष्य” कम है, संतुलित के साथ “ओ” की तुलना में अधिक दोहराया किसी भी अन्य पत्र में शब्द.

खिंचाव के लिए संदर्भित करता है कि कैसे लंबे समय से एक शब्द हो जाता है । उदाहरण के लिए, कम शब्दों या ध्वनियों की तरह “हा” के एक उच्च डिग्री है खिंचाव के कारण लोगों को अक्सर उन्हें दोहराना कई बार (जैसे, “hahahahahahahaha”). इस बीच, नियमित रूप से शब्द की तरह “इन्फिनिटी” कम खिंचाव के साथ अक्सर, सिर्फ एक पत्र दोहराया: “infinityyyy.”

इस विश्लेषण के लिए, शोधकर्ताओं ने विकसित किया है विभिन्न उपकरणों और तरीकों कि इस्तेमाल किया जा सकता है में भविष्य के अनुसंधान के स्केलेबल शब्दों में, इस तरह के रूप में जांच की एमआईएस-typings और ग़लत वर्तनी. उपकरण भी लागू किया जा सकता सुधार करने के लिए प्राकृतिक भाषा प्रसंस्करण, खोज इंजन, और स्पैम फिल्टर

लेखकों को जोड़ने: “हम करने में सक्षम थे व्यापक इकट्ठा करने और गिनती बढ़ाकर शब्दों की तरह ‘gooooooaaaalll’ और ‘hahahaha’, और उन्हें नक्शा भर में दो आयामों के समग्र stretchiness और संतुलन का खिंचाव है, जबकि विकास के नए उपकरण है कि में सहायता करेगा उनके निरंतर भाषाई अध्ययन, और अन्य क्षेत्रों में, इस तरह के रूप में भाषा संसाधन बढ़ाने, शब्दकोशों में सुधार, खोज इंजन, विश्लेषण के निर्माण के दृश्यों, और अधिक.”

कहानी का स्रोत:

द्वारा उपलब्ध कराई गई सामग्री PLOS. नोट: सामग्री संपादित किया जा सकता है के लिए शैली और लंबाई ।



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *